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Python 由 Guido van Rossum 于 1989 年 底 开 始 研制 ,第 一 个 版 本 发 行 于 1991 年 。 
Python 推出 不 久 就 迅速 得 到 了 各 行业 人 士 的 青睐 ,经 过 近 30 年 的 发 展 ,已 经 渗透 到 计算 
机 科学 与 技术 、 统 计 分 析 、 逆 向 工程 与 软件 分 析 、 电 子 取证 、 图 形 图 像 处 理 \ 人 工 智能 、 游 戏 
设计 与 策划 、 网 站 开发 .移动 终端 开发 、 大 数据 分 析 与 处 理 、 深 度 学 习 、 科 学 计算 可 视 化 \ 云 
计算 、 网 络 爬 虫 开 发 、 系 统 运 维 、 自 然 语言 处 理 、 密 码 学 .电子 电路 设计 、 树 莓 派 开发 等 专业 
和 领域 。 目 前 ,Python 已 经 成 为 卡耐基 梅 隆 大 学 、 麻 省 理工 学 院 、 加 州 大 学 伯克利 分 校 、 
哈佛 大 学 等 国外 很 多 大 学 计算 机 专业 或 非 计算 机 专业 的 程序 设计 入 门 教学 语言 ,国内 也 
有 不 少 学 校 的 多 个 专业 陆续 开设 了 Python 程序 设计 课程 。 

Python 连续 多 年 在 TIOBE 网 站 的 编程 语言 排行 榜 上 排名 前 十 位 ,并 于 2011 年 1 月 被 
TIOBE 网 站 评 为 2010 年 度 语言 。 自 2015 年 之 后 ,Python 一 直 稳 居 TIOBE 编程 语言 排行 
榜 前 五 位 。 在 2014 年 12 月 份 IEEE Spectrum 推出 的 编程 语言 排行 榜 中 ,Python 排 第 5 位 ， 
而 在 2017 年 7 月 份 IEEE Spectrum 推出 的 编程 语言 排行 榜 中 ,Python 上 升 到 了 第 1 位 。 

Python 是 一 门 免费 、 开 源 的 跨 平 台 高 级 动态 编程 语言 ,支持 命令 式 编程 .函数 式 编 
程 ,完全 支持 面向 对 象 程序 设计 ,语法 简洁 清晰 ,并 且 拥 有 大 量 功 能 强大 的 标准 库 和 扩展 
库 以 及 众多 狂热 的 支持 者 ,可 以 帮助 各 领域 的 科研 人 员 或 策划 师 甚至 管理 人 员 快 速 实现 
和 验证 自己 的 思路 与 创意 。Python 用 户 可 以 把 主要 精力 放 在 业务 逻辑 的 设计 与 实现 上 ， 
而 不 用 过 多 考虑 语言 本 身 的 细节 ,开发 效率 非常 高 ,其 精妙 之 处 令 人 击 节 吧 赏 。 

Python 是 一 门 快乐 的 语言 ,学 习 和 使 用 Python 也 是 一 个 快乐 的 过 程 。 与 C 语言 系列 
和 Java 等 语言 相 比 ,Python 更 加 容易 学 习 和 使 用 ,但 这 并 不 意味 着 可 以 非常 轻松 愉快 地 
掌握 Python。 用 户 熟 练 掌握 和 运用 Python 仍 需 要 通过 大 量 的 练习 来 锻炼 自己 的 思维 和 
熟悉 Python 编程 模式 ,同时 还 需要 经 常 关注 Python 社区 优秀 的 代码 以 及 各 种 扩展 库 的 
最 新 动态 。 当 然 , 如 果 能 够 适当 了 解 Python 标准 库 以 及 扩展 库 的 内 部 工作 原理 ,对 于 编 
写 正确 而 优雅 的 Python 程序 无 疑 是 有 很 大 帮助 的 。 

Python 是 一 门 优雅 的 语言 。Python 语法 简洁 清晰 ,并 且 提 供 了 大 量 的 内 置 对 象 和 
内 置 函 数 ,编程 模式 非常 符合 人 类 的 思维 方式 和 习惯 。 在 有 些 编程 语言 中 需要 编写 大 量 
代码 才能 实现 的 功能 ,在 Python 中 仅 需 要 调用 内 置 函数 或 内 置 对 象 的 方法 即 可 实现 。 
如 果 读 者 已 有 其 他 程序 设计 语言 的 基础 ,那么 在 学 习 和 使 用 Python 时 ,一 定 不 要 把 其 他 
语言 的 编程 习惯 和 风格 带 到 Python 中 来 ,因为 这 不 仅 可 能 会 使 得 代码 变 得 非常 宛 余 、 烦 
琐 , 还 可 能 会 严重 影响 代码 的 运行 效率 。 应 该 尽量 尝试 从 最 自然 .最 简洁 的 角度 出 发 去 思 
考 和 解决 问题 ,这 样 才 能 写 出 更 加 优雅 更 加 纯正 、 更 加 Pythonic 的 代码 。 
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本 书 内 容 组 织 


对 于 Python 程序 员 来 说 ,能 够 熟练 运用 各 种 扩展 库 毫 无 疑问 是 非常 重要 的 ,使 用 优 
秀 、 成 熟 的 扩展 库 可 以 帮助 我 们 快速 实现 自己 的 业务 逻辑 和 创意 。 但 是 也 必须 清楚 地 认 
识 到 ,Python 内 功 是 非常 重要 的 ,Python 语言 基础 知识 和 基本 数据 结构 的 熟练 掌握 是 理 
解 和 运用 其 他 扩展 库 的 必 备 条 件 之 一 。 所 以 ,本 书 前 11 章 把 重点 和 主要 篇 幅 放 在 了 
Python 编程 基础 知识 的 介绍 上 ,通过 大 量 案例 介绍 Python 在 实际 开发 中 的 应 用 ,然后 在 
最 后 两 章 介绍 数据 库 编 程 和 Python 在 数据 分 析 、 处 理 与 科学 计算 可 视 化 等 领域 的 应 用 。 
关于 其 他 应 用 领域 的 扩展 库 可 以 参考 本 书 最 后 的 附录 ,并 结合 自己 的 专业 领域 查阅 相关 
文档 。 全 书 共 13 章 ,主要 内 容 组 织 如 下 。 

第 1 章 管中窥豹 : Python 概述 。 介 绍 Python 语言 的 特点 ,Python 程序 文件 名 , 扩 
展 库 的 管理 与 使 用 ,Python 代码 编写 规范 和 优化 建议 。 

第 2 章 万 丈 高 楼 平地 起 : 运算 符 、 表 达 式 与 内 置 对 象 。 讲 解 Python 对 象 模 型 , 数 
字 、 字 符 串 、 列 表 、 元 组 字典、 集合 等 基本 数据 类 型 ,运算 符 与 表达 式 , 内 置 函数 。 

第 3 章 玄 之 又 玄 , 众 妙 之 门 : 详解 Python 序列 结构 。 讲 解 列表 、 元 组 .字典 、 集 合 
等 序列 的 常用 方法 和 基本 操作 ,切片 操作 ,列表 推导 式 , 元 组 与 生成 器 推导 式 , 序 列 解 包 ， 
字典 、 集 合 基本 操作 和 常用 方法 。 

第 4 章 反 者 , 道 之 动 : 程序 控制 结构 。 讲 解 Python 选择 结构 ,for 循环 与 while 循 
环 , 带 有 else 子 名 的 循环 结构 ,break 与 continue 语句 ,选择 结构 与 循环 结构 的 综合 运用 。 

第 5 章 代码 复 用 技术 (一 ): 函数 。 讲 解 函数 的 定义 与 使 用 ,普通 位 置 参数 .关键 参 
数 、 默 认 值 参数 ,长 度 可 变 参 数 等 不 同 参数 类 型 ,全 局 变量 与 局 部 变量 ,参数 传递 时 的 序列 
解 包 ,return 语句 ,lambda 表达 式 。 

第 6 章 代码 复 用 技术 (二 ): 面向 对 象 程序 设计 。 讲 解 类 的 定义 与 继承 ,self 与 cls 
参数 ,类 成 员 与 实例 成 员 , 私 有 成 员 与 公有 成 员 , 特 殊 方法 与 运算 符 重 载 。 

第 7 章 文本 处 理 ( 一 ) : 字符 串 。 讲 解 字符 串 编码 格式 ,字符 串 格 式 化 ,替换 、 分 割 、 
连接 、 排 版 等 基本 操作 方法 。 

第 8 章 文本 处 理 ( 二 ): 正则 表达 式 。 讲 解 正 则 表达 式 语法 、 正 则 表达 式 对 象 . 子 模 
式 与 match 对 象 ,以 及 Python 正则 表达 式 模块 re 的 应 用 。 

第 9 章 数据 永久 化 : 文件 内 容 操作 。 讲 解 文件 操作 基本 知识 与 Python 文件 对 象 ， 
文本 文件 内 容 读 写 ,二进制 文件 内 容 读 写 与 对 象 序列 化 , Word、Excel 等 常见 二 进 制 文件 
的 内 容 读 写 。 

第 10 章 文件 与 文件 夹 操作 。 讲 解 文件 复制 、 移 动 . 重 命名 .遍历 等 文件 级 操作 以 及 
目录 操作 有 关 知 识 。 

第 11 章 代码 质量 保障 : 异常 处 理 结构 与 单元 测试 。 讲 解 Python 异常 类 层次 结构 
与 自 定 义 异 常 类 ,多 种 不 同形 式 的 异常 处 理 结构 ,以 及 单元 测试 。 

第 12 章 数据 库 应 用 开发 。 讲 解 SQLite 数据 库 的 基本 特点 与 用 法 ,以 及 Python 对 
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SQLite 数据 库 和 Access、MySQL、MS SQL Server 等 数据 库 的 操作 方法 。 

第 13 章 数据 分 析 与 科学 计算 可 视 化 。 讲 解 Python 标准 库 statistics 以 及 numpy、 
scipy、pandas、matplotlib 等 扩展 库 的 用 法 ,讲解 数据 处 理 、 数 据 分 析 、 数 据 可 视 化 以 及 科 
学 计算 的 有 关内 容 。 


本 书 特 色 


内 容 与 Python 最 新 版 本 同步 。 本 书 完全 面向 Python 3. x, 全 部 案例 代码 使 用 
Python 3. 5.x 和 Python 3. 6. x 编写 ,大 部 分 内 容 同 样 适用 于 Python 3. 4. x。 

信息 量 大 、 知 识 点 密集 。 全 书 没有 多 余 的 文字 和 软件 安装 截图 ,充分 利用 宝贵 的 篇 幅 
来 介绍 和 讲解 尽 可 能 多 的 知识 点 ,绝对 物 超 所 值 。 本 书 作者 具有 15 年 程序 设计 教学 经 
验 , 讲 授 过 汇编 语言 .C/C++ /C# 、Java、.PHP、Python 等 多 门 程序 设计 语言 ,并 编写 过 大 
量 的 应 用 程序 。 在 本 书 内 容 的 组 织 和 安排 上 ,结合 了 作者 多 年 教学 与 开发 过 程 中 积累 的 
许多 案例 ,并 巧妙 地 粳 合 进 了 相应 的 章节 。 

案例 丰富 ,实用 性 强 , 注 杰 量 大 。 精 选 多 个 领域 中 的 经 典 案例 ,并 且 每 段 代 码 都 配 有 
大 量 注释 ,大 幅度 缩短 了 读者 理解 代码 所 需要 的 时 间 。 

语言 精练 ,代码 优雅 。 使 用 最 简练 的 语言 和 代码 介绍 Python 语法 和 应 用 ,完美 诠释 
Pythonic 真 谤 。 

深度 与 广度 兼顾 。 本 书 对 Python 内 部 工作 原理 进行 一 定 程 序 的 剖析 ,并 适当 介绍 
Python 代码 优化 和 安全 编程 的 有 关 知 识 , 可 以 满足 不 同 层 次 读者 的 需要 ,读者 对 书 中 内 
容 每 多 读 一 遍 都 会 有 新 的 收获 和 体会 。 
本 书 适用 读者 

本 书 可 以 作为 (但 不 限于 ) ， 

。 会计、 经济、 金融 ,心理 学 统计 、 管 理 `、 人 文 社 科 以 及 其 他 非 计算 机 专业 本 科 或 专 

科 的 程序 设计 教材 。 如 果 作 为 本 科 非 计算 机 专业 程序 设计 语言 公共 课 或 选修 课 
教材 ,建议 采用 64 学 时 或 48 学 时 边 讲 边 练 的 教学 模式 。 

。 具有 一 定 Python 基础 的 读者 进 阶 学 习 资 料 。 
打算 利用 业余 时 间 学 习 一 门 快 乐 的 程序 设计 语言 并 编写 几 个 小 程序 来 娱乐 的 读 
者 首选 学 习 资料 。 
少数 对 编程 具有 浓厚 兴趣 和 天 赋 的 中 学 生 课 外 阅读 资料 。 


教学 资源 


本 书 提供 全 套 教 学 课件 、 源 代码 、 课 后 习题 答案 与 分 析 、 考 试题 库 、 教 学 视频 、 教 
案 以 及 授课 计划 和 学 时 分 配 表 ,需要 配套 资源 ,可 以 登录 清华 大 学 出 版 社 官方 网 站 
《www. tup. com. cn) 下 载 或 与 作者 联系 索取 ,作者 的 微 信 公众 号 是 “Python 小 屋 ”, 电 子 
邮箱 地 址 是 dongfuguo2005@126. com。 

由 于 时 间 仓 促 , 作 者 水 平 有 限 , 书 中 难免 存在 疏漏 之 处 ,还 请 同行 指正 并 通过 作者 联 
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1.1 Python 是 这 样 一 种 语言 


有 不 少 人 说 Python 是 一 种 “大 蟒蛇 语言 ”。 虽 然 在 英语 中 Python 确实 有 大 蟒蛇 的 
意思 ,但 Python 语言 和 大 蟒蛇 却 没 有 任何 关系 。Python 语言 的 名 字 来 自 一 个 著名 的 电 
视 剧 Monty Python”s Flying Circus ,Python 之 父 Guido van Rossum 是 这 部 电视 剧 的 狂 
热爱 好 者 ,所 以 把 他 设计 的 语言 命名 为 Python。 

也 有 人 说 Python 是 一 门 脚本 语言 ,这 也 不 准确 , 远 远 不 足以 反映 Python 的 强大 。 
Python 并 不 仅仅 是 一 门 脚本 语言 ,更 是 一 门 跨 平台 、 开 源 、 免 费 的 解释 型 高 级 动态 编程 语 
言 , 是 一 种 通用 编程 语言 。 除 了 可 以 解释 执行 之 外 ,Python 还 支持 将 源 代码 伪 编 译 为 字 
节 码 来 优化 程序 提高 加 载 和 运行 速度 并 对 源 代码 进行 保密 ,也 支持 使 用 py2exe、 
pyinstaller、cx_Freeze 或 其 他 类 似 工具 将 Python 程序 及 其 所 有 依赖 库 打包 成 为 各 种 平台 
上 的 可 执行 文件 ,当然 也 包括 扩展 名 为 exe 的 Windows 可 执行 程序 ,从 而 可 以 脱离 
Python 解释 器 环境 和 相关 依赖 库 , 能 够 在 Windows 平台 上 独立 运行 ,并 且 还 支持 制作 
成 . msi 安装 包 ;Python 支持 命令 式 编程 (How to do) 和 函数 式 编程 (What to do) 两 种 方 
式 , 完 全 支持 面向 对 象 程序 设计 ,语法 简洁 清晰 ,功能 强大 且 易 学 易 用 ,更 重要 的 是 拥有 大 
量 的 几乎 支持 所 有 领域 应 用 开发 的 成 熟 扩展 库 和 狂热 支持 者 。 

当然 ,也 有 人 喜欢 把 Python 称 为 “胶水 语言 ,这 确实 是 Python 的 重要 特点 之 一 。 
它 可 以 把 多 种 不 同 语言 编写 的 程序 融合 到 一 起 实现 无 颖 拼接 ,更 好 地 发 挥 不 同 语言 和 工 
有 具 的 优势 ,满足 不 同 应 用 领域 的 需求 。 


1.2 Python 版 本 之 争 


众所周知 ,Python 官方 网 站 同时 发 行 和 维护 着 Python 2. x 和 Python 3. x 两 个 不 同 
系列 的 版 本 ,并 且 版 本 更 新 速度 非常 快 (6 个 月 左右 更 新 一 次 小 版 本 号 ) 。 目 前 最 新 版 本 
分 别 是 Python 2. 7. 14、Python 3. 4.7、Python 3. 5. 4 和 Python 3. 6. 3, Python 3.7 已 在 
研发 中 ,估计 很 快 就 会 推出 。Python 2. x 和 Python 3. x 这 两 个 系列 的 版 本 之 间 很 多 用 法 
是 不 兼容 的 (让 人 欣慰 的 是 .除了 一 些 新 特性 、 运 算 符 和 标准 库 对 象 之 外 ,同一 个 系列 的 不 
同 版 本 之 间 绝 大 多 数 用 法 是 完全 一 致 的 ) ,除了 基本 输入 输出 方式 有 所 不 同 , 很 多 内 置 函 
数 和 标准 库 对 象 的 用 法 也 有 非常 大 的 区 别 。Python 3.x 在 增加 了 很 多 新 标准 库 的 同时 也 
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删除 了 一 些 Python 2. x 的 标准 库 , 还 有 些 Python 2. x 的 标准 库 在 Python 3. x 中 进行 了 
合并 和 拆 分 。 当 然 , 适 用 于 Python 2. x 和 Python 3. x 的 扩展 库 之 间 更 是 差别 巨大 ,这 应 
该 是 现 有 系统 进行 版 本 迁移 时 的 最 大 障碍 。 所 以 ,在 正式 开始 使 用 Python 之 前 ,必须 要 
选择 合适 的 版 本 ,以 免 浪 费时 间 。 

总 体 来 看 ,Python 3. x 的 设计 理念 更 加 合理 、 高 效 和 人 性 化 ,全 面 普及 和 应 用 是 必然 
的 , 越 来 越 多 的 扩展 库 也 以 非常 快 的 速度 推出 了 与 最 新 Python 版 本 相 适 应 的 版 本 。 如 
果 和 暂时 还 没 想到 要 做 什么 行业 领域 的 应 用 开发 ,或 者 仅仅 是 为 了 尝试 一 种 新 的 好 玩 的 语 
言 ,那么 请 毫 不 犹 殉 地 选择 Python 3. x 系列 的 最 高 版 本 。 


1.3 Python 编程 规范 与 代码 优化 建议 


没有 规矩 ,不 成 方圆 。 任 何 一 种 语言 都 有 一 些 约 定 俗 成 的 编码 规范 ,Python 也 不 例 
外 。Python 非常 重视 代码 的 可 读 性 ,对 代码 布局 和 排版 有 更 加 严格 的 要 求 。 虽 然 一 些 大 
型 软件 公司 对 自己 公司 程序 员 编 写 的 代码 在 布局 结构 ,标识 符 命名 等 方面 有 一 些 特 殊 的 

Ee 但 其 中 很 多 思想 是 相同 的 ,目的 也 是 一 致 的 。 这 里 重点 介绍 Python 社区 对 代码 编 
一 些 共 同 的 要 求 ,规范 和 一 些 常 用 的 代码 优化 建议 ,最 好 在 开始 编写 第 一 段 代码 时 就 
sth 个 好 习惯 。 

(1) 严格 使 用 缩 进 来 体现 代码 的 逮 辑 从 属 关系 。Python 对 代码 缩 进 是 硬性 要 求 ,这 
一 点 必须 时 刻 注意 。 如 果 某 个 代码 段 的 缩 进 不 对 ,那么 整个 程序 就 是 错 的 ,要 么 是 语法 错 
误 无 法 执行 ,要 么 是 逻辑 错误 导致 错误 结果 ,而 检查 这 样 的 错误 会 花费 很 多 时 间 。 

(2) 每 个 import 语句 只 导入 一 个 模块 ,最 好 按 标准 库 、 扩 展 库 、 自 定义 库 的 顺序 依次 
导 和 人 和。 尽量 避免 导入 整个 库 , 最 好 只 导入 确实 需要 使 用 的 对 象 , 这 会 让 程序 运行 更 快 。 

(3) 最 好 在 每 个 类 、 函 数 定义 和 一 段 完 整 的 功能 代码 之 后 增加 一 个 空 行 ,在 运算 符 两 
侧 各 增加 一 个 空格 ,逗号 后 面 增加 一 个 空格 。 按 照 这 样 的 规范 写 出 来 的 代码 布局 和 排版 
比较 松散 ,阅读 起 来 更 加 轻松 。 不 论 是 前 面 第 一 条 讲 的 缩 进 , 还 是 这 里 谈 的 空 行 与 空格 ， 
主要 是 提高 代码 可 读 性 ,正如 The Zen of Python 所 说 : Sparse is better than dense， 
readability counts。 稍 微 有 点 例外 的 是 ,在 正常 的 赋值 表达 式 中 等 号 两 侧 都 是 各 增加 一 
个 空格 ,但 在 定义 函数 的 默认 值 参 数 和 使 用 关键 参数 调用 函数 时 一 般 并 不 在 参数 赋值 的 
等 号 两 侧 增 加 空格 。 这 样 松 中 有 紧 也 是 为 了 提高 代码 的 可 读 性 , 正 所 谓 :“ 张 而 不 弛 , 文 
武 弗 能 也 ; 弛 而 不 张 ,文武 弗 为 也 ; 一 张一弛 ,文武 之 道 也 。” 

(4) 尽量 不 要 写 过 长 的 语句 。 如 果 语 句 过 长 ,可 以 考虑 拆 分 成 多 个 短 一 些 的 语句 ,以 
保证 代码 具有 较 好 的 可 读 性 。 如 果 语 句 确 实 太 长 而 超过 屏幕 宽度 ,最 好 使 用 续 行 符 (line 
continuation character)“\”, 或 者 使 用 圆 括号 将 多 行 代 码 括 起 来 表示 是 一 条 语句 。 

(5) 虽然 Python 运算 符 有 明确 的 优先 级 ,但 对 于 复杂 的 表达 式 建议 在 适当 的 位 置 使 
用 括号 使 得 各 种 运算 的 隶属 关系 和 计算 顺序 更 加 明确 ,正如 The Zen of Python 所 说 : 
Explicit is better than implicit 。 

(6) 对 关键 代码 和 重要 的 业务 逻辑 代码 进行 必要 的 注释 。 统 计数 据 表明 ,一 个 可 读 
性 较 好 的 程序 中 应 包含 大 概 30% 以 上 的 注释 。 在 Python 中 有 两 种 常用 的 注释 形式 : # 
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和 三 引号 。# 用 于 单行 注释 ,三 引号 常用 于 大 段 说 明 性 文本 的 注释 。 

(7) 在 开发 速度 和 运行 速度 之 间 尽 量 取得 最 佳 平衡 。 内 置 对 象 运行 速度 最 快 ,标准 
库 对 象 次 之 ,用 C 或 FORTRAN 编写 的 扩展 库 速度 也 比较 快 ,而 纯 Python 的 扩展 库 往 
往 速度 慢 一 些 。 所 以 ,在 开发 项 目 时 ,应 优先 使 用 Python 内 置 对 象 ,其 次 考虑 使 用 
Python 标准 库 提供 的 对 象 ,最 后 考虑 使 用 第 三 方 扩展 库 。 然 而 ,有 时 候 只 使 用 内 置 对 象 
和 标准 库 对 象 的 话 ,很 可 能 无 法 直接 满足 需要 。 这 时 候 有 两 个 选择 : 一 是 使 用 内 置 对 象 
和 标准 库 对 象 编写 代码 实现 特定 的 逻辑 ;二 是 使 用 合适 的 扩展 库 对 象 。 至 于 如 何 取舍 ,最 
终 还 是 取决 于 业务 逻辑 的 复杂 程度 和 对 运行 速度 的 要 求 这 两 者 之 间 的 平衡 。 

(8) 根据 运算 特点 选择 最 合适 的 数据 类 型 来 提高 程序 的 运行 效率 。 如 果 定 义 一 些 数 
据 只 是 用 来 频繁 遍历 ,最 好 优先 考虑 元 组 或 集合 。 如 果 需 要 频繁 地 测试 一 个 元 素 是 否 存 
在 于 一 个 序列 中 并 且 不 关心 其 位 置 , 尽 量 采 用 字典 或 者 集合 。 列 表 和 元 组 的 in 操作 的 时 
间 复 杂 度 是 线性 的 ,而 对 于 集合 和 字典 却 是 常数 级 的 ,与 问题 规模 几乎 无 关 。 在 所 有 内 置 
数据 类 型 中 ,列表 的 功能 最 强大 ,但 开销 也 最 大 ,运行 速度 最 慢 ,应 慎重 使 用 。 作 为 建议 ， 
应 优先 考虑 使 用 集合 和 字典 ,元 组 次 之 ,最 后 考虑 列表 和 字符 串 。 

(9) 充分 利用 关系 运算 符 以 及 逮 辑 运算 符 and 和 or 的 惰性 求 值 特点 ,合理 组 织 条 件 
表达 式 中 多 个 条 件 的 先后 顺序 ,减少 不 必要 的 计算 。 

(10) 充分 利用 生成 器 对 象 或 类 似 迭 代 对 象 的 惰性 计算 特点 ,尽量 避免 将 其 转换 为 列 
表 , 元 组 等 类 型 ,这 样 可 以 减少 对 内 存 的 占用 ,降低 空间 复杂 度 。 

(11) 减少 内 循环 中 的 无 关 计 算 , 尽 量 往外 层 提取 。 

有 很 多 成 熟 的 工具 可 以 检查 Python 代码 的 规范 性 ,如 pep8、flake8、pylint 等 。 可 以 使 用 
pip 来 安装 pep8 工具 ,然后 使 用 命令 pep8 test. py 来 检查 test. py 文件 中 Python 代码 的 规范 
性 。pep8 常用 的 可 选 参数 有 一 show-source、-first、 一 show-pep8 等 。flake8 结合 了 pyflakes 和 
pep8 的 特点 ,可 以 检查 更 多 的 内 容 , 优 先 推荐 使 用 ,使 用 pip install flake8 可 以 直接 安装 , 然 
后 使 用 命令 flake8 test. py 检查 test. py 中 代码 的 规范 性 。 也 可 以 使 用 pip 安装 pylint, 然 后 
使 用 命令 行 工具 pylint 或 者 可 视 化 工具 pylint-gui 来 检查 程序 的 规范 性 。 


1.4 Anaconda3 开发 环境 的 安装 与 使 用 


Python 的 开发 环境 非常 多 ,可 以 根据 自己 的 使 用 习惯 进行 选择 。 除 了 Python 官方 网 
站 提供 的 IDLE 开发 环境 ,还 有 PyCharm、wingIDE、PythonWin、Eclipse 十 PyDev、Eric。 另 外 ， 
为 了 方便 使 用 Python, Anaconda、Python(x,y)、zwPython 等 安装 包 集 成 了 大 量 常 用 的 
Python 扩展 库 , 大 幅度 节约 了 用 户 配置 Python 开发 环境 的 时 间 。 本 书 选择 了 目前 在 教学 和 
科研 中 使 用 较 多 的 Anaconda3, 但 这 并 不 是 必需 的 , 书 中 代码 同样 适用 于 其 他 开发 环境 。 

登录 网 址 https://www. continuum. io/downloads 下 载 Anaconda3 并 安装 之 后 ,“ 开 
始 ” 菜 单 中 会 增加 图 1-1 显示 的 菜单 ,其 中 Jupyter Notebook 和 Spyder 是 使 用 较 多 的 两 
个 开发 环境 。 启动 Jupyter Notebook 之 后 ,在 右上 角 单 击 New, 然 后 选择 Python 
[default]( 见 图 1-2) 进 入 交互 式 开发 环境 ,在 单元 格 内 输入 代码 块 后 单 击 图 1-3 中 箭头 所 
指 的 按钮 即 可 运行 输入 的 代码 并 立刻 得 到 结果 。 
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| Aracondas cab 


Anaconda Cloud 










Anaconda Navigator 


upoad BE > 


Anaconda prompt Tex Fie 
Ipython Folder 
Jupyter No Terminals Unavailable 
ee Notebooks 

Python [conda root] 





Python [default] 





图 1-1 Anaconda3 菜单 图 1-2 启动 Jupyter Notebook 





> JUu pyter Untitled9 Last Checkpoint a minute ago (unsaved changes) 


Fie Edt View Inset Cel Kemel Widgets Help 
B+ Xam 个 viHIDIC lcoe vi lceloolbar @ 0 0 


In [1]: |print('Hello world’) 


Hello world 


In [2]: | import math 


print (math.sqrt (9)) 


3.0 





[= 











图 1-3 Jupyter Notebook 交互 式 编程 界面 


启动 Spyder 之 后 ,可 以 选择 使 用 主 界面 右 侧 的 IPython 或 Python 交互 模式 ,也 可 以 


在 主 界面 左 侧 编写 程序 文件 并 直接 运行 ,如 图 1-4 和 图 1-5 所 示 。 
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Permissions Ww End-of lines: an 


Encoding: asal 


Line 1 Colimr: 25_ Memory: 41% 








图 1-4 在 Spyder 中 使 用 Python 控制 台 交 互 编程 环境 
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unfile( "Cs/Users/d/ .spycer-py3/tenp.py's wlir="C: /Users/ 
) 
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图 1-5 在 Spyder 中 使 用 IPython 交互 编程 环境 ,编写 和 运行 程序 文件 








1.5 安装 扩展 库 的 几 种 方法 


除了 使 用 源码 安装 和 二 进 制 安装 包 ( 并 不 是 所 有 扩展 库 都 提供 这 种 方式 ) 以 外 ,easy_ 
install 和 pip 工具 已 经 成 为 管理 Python 扩展 库 的 主要 方式 ,其 中 pip 用 得 更 多 一 些 。 使 
用 pip 不 仅 可 以 查看 本 机 已 安装 的 Python 扩展 库 列 表 , 还 支持 Python 扩展 库 的 安装 、 升 
级 和 印 载 等 操作 。 使 用 pip 工具 管理 Python 扩展 库 只 需要 在 保证 计算 机 联网 的 情况 下 
输入 几 个 命令 即 可 完成 , 极 大 地 方便 了 用 户 。 常 用 pip 命令 的 使 用 方法 如 表 1-1 所 示 。 
表 1-1 常用 pip 命令 的 使 用 方法 





























pip 命令 示例 说 有 明 
pip download SomePackage[ = = version] 下 载 扩展 库 的 指定 版 本 ,不 安装 
pip freeze 以 requirements 的 格式 列 出 已 安装 模块 
pip list 列 出 当前 已 安装 的 所 有 模块 
pip install SomePackage[ = = version] 在 线 安 装 SomePackage 模块 的 指定 版 本 
Pip install SomePackage. whl 通过 whl 文 件 离线 安装 扩展 库 
pip install packagel package2… 依次 (在 线 ) 安 装 packagel ,package2 等 扩展 模块 
pip install -r requirements. txt 安装 requirements. txt 文件 中 指定 的 扩展 库 
Midill -paule Semebackige 升级 SomePackage 模块 
pip uninstall SomePackage[ = = version] 务 载 SomePackage 模块 的 指定 版 本 








在 https://pypi. python. org/pypi 中 可 以 获得 一 个 Python 扩展 库 的 综合 列表 ,可 以 
根据 需要 下 载 源码 进行 安装 或 者 使 用 pip 工具 进行 在 线 安装 ,也 有 一 些 扩 展 库 还 提供 了 
. whl 文件 和 . exe 文件 ,大 幅度 简化 了 扩展 库 的 安装 过 程 。 有 些 扩 展 库 安装 时 要 求 本 机 
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已 安装 相应 版 本 的 C/C++ 编译 器 ,或 者 有 些 扩展 库 暂 时 还 没有 与 本 机 Python 版 本 对 应 
的 官方 版 本 ,这 时 可 以 从 http://www. lfd. uci. edu/ 一 gohlke/pythonlibs/ 下 载 对 应 的 
. whl 文 件 (注意 ,不 要 修改 文件 名 ) ,然后 在 命令 提示 符 环境 中 使 用 pip 命令 进行 安装 。 
例如 : 


pip install pygame 1.9.2a0- cp35- none_ win amd64.whl 


一 般 来 讲 ,使 用 pip 工具 在 线 安装 总 是 会 自动 选择 扩展 库 的 最 新 版 本 ,但 有 时 会 出 现 
新 版 本 与 其 他 扩展 库 不 兼容 的 情况 ,或 者 其 他 扩展 库 依赖 待 安装 扩展 库 的 较 低 版 本 ,这 时 
可 以 明确 指定 扩展 库 的 版 本 号 ,例如 : 

pip install requests==2.12.4 

如 果 需 要 安装 的 扩展 库 比较 多 ,并 且 对 版 本 号 要 求 严格 ,可 以 使 用 类 似 于 pip install 
-r requirements. txt 这 样 的 命令 从 requirements. txt 文件 中 读 取 所 需 安装 的 扩展 库 信息 
并 自动 安装 。 这 个 requirements. txt 可 以 手工 编辑 ,也 可 以 使 用 pip freeze 过 
requirements. txt 命令 把 本 机 已 安装 模块 的 信息 快速 生成 为 requirements. txt 文件 。 在 
命令 提示 符 环境 中 直接 执行 pip 命令 可 以 查看 其 他 子 命令 ,例如 wheel。 然 后 执行 pip 
wheel -h 可 以 查看 子 命令 的 详细 用 法 ,不 再 次 述 。 

成 功 安 装 Anaconda3 之 后 ,也 可 以 使 用 命令 行 工 具 conda 管理 Python 扩展 库 , 用 法 
与 pip 类 似 , 不 再 袭 述 。 


1.6 标准 库 与 扩展 库 中 对 象 的 导入 与 使 用 


Python 默认 安装 仅 包 含 基本 或 核心 模块 ,启动 时 也 仅 加 载 了 基本 模块 ,在 需要 时 再 
显 式 地 导入 和 加 载 标准 库 和 第 三 方 扩展 库 , 这 样 可 以 减 小 程序 运行 的 压力 ,并 且 具 有 很 强 
的 可 扩展 性 。 从 “ 木 桶 原理 ”的 角度 来 看 ,这 样 的 设计 与 安全 配置 时 遵循 的 * 最 小 权限 ” 原 
则 是 一 致 的 ,也 有 助 于 提高 系统 的 安全 性 。 


161 import 模块 名 [as 别名 ] 


使 用 这 种 方式 导入 以 后 ,使 用 时 需要 在 对 象 之 前 加 上 模块 名 作为 前 缀 ,必须 以 “模块 
名 . 对 象 名 ”的 形式 进行 访问 。 如 果 模 块 名 字 很 长 的 话 ,可 以 为 导入 的 模块 设置 一 个 别名 ， 
然后 使 用 “别名 . 对象 名 ”的 方式 来 使 用 其 中 的 对 象 。 


>>> import math # 导 入 标准 库 math 
>>>math.sin(0.5) # 求 0.5 人 单位 是 弧度 ) 的 正弦 
0.479425538604203 

>>> import randm # 导 人 标准 库 random 

>>>m random.random() # 获 得 [0,1) 内 的 随机 小 数 
>>> re random. randint (1, 100) # 获 得 [1,100) 区 间 的 随机 整数 
>>> rr random. randrange (1, 100) # 返 回 [1,100) 区 间 的 随机 整数 


>>> import os.path as path # 导 和 人 标准 库 os.path, 并 设置 别名 为 Path 





162 


导入 


不 需 
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>>> path.isfile(r'C:\windows\notepad.exe') 

True 

>>> import numpy as mp # 导 入 扩展 库 mmpy, 并 设置 别名 为 mp 
>>> emp-array((1,2,3,4)) # 通 过 模块 的 别名 来 访问 其 中 的 对 象 
>>>a 

array([1,2,3,4]) 

>>>print (a) 

[1234 


from 模 块 名 impot 对 象 名 [as 别名] 
使 用 这 种 方式 仅 导入 明确 指定 的 对 象 ,并 且 可 以 为 导入 的 对 象 确定 一 个 别名 。 这 种 


方式 可 以 减少 查询 次 数 , 提 高 访问 速度 ,同时 也 可 以 减少 程序 员 需 要 输入 的 代码 量 ， 
要 使 用 模块 名 作为 前 级 。 

>>> fram math import sin # 只 导 和 人 模块 中 的 指定 对 象 

>>> sin(3) 

0.1411200080598672 

>>> fram math import sin as f # 给 导 和 人 的 对 象 起 个 别名 

>>> £(3) 


0.1411200080598672 
>>> fram os.path jimport isfile 
>>> isfile(r'C:\windows\notepad.exe') 


True 
163 from 模块 名 import * 

这 是 上 面 用 法 的 一 种 极端 情况 ,可 以 一 次 导入 模块 中 通过 __all__ 变 量 指定 的 所 有 
对 象 。 

>>> fram math import * # 导 入 标准 库 math 中 的 所 有 对 象 

>>> god(36,18) # 最 大 公约 数 

18 

>>>pi # 常 数 一 

3.141592653589793 

>>>e # 常 数 = 

2.718281828459045 

>>> log2(8) 专 计 算 以 2 为 底 的 对 数值 

3.0 

>>> log10 (100) # 计 算 以 10 为 底 的 对 数值 

2 

>>> radians(180) # 把 角度 转换 为 弧度 


3.141592653589793 


SS 
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这 种 方式 简单 粗暴 , 写 起 来 也 比较 省 事 , 可 以 直接 使 用 模块 中 的 所 有 对 象 而 不 需要 
再 使 用 模块 名 作为 前 级 。 但 一 般 并 不 推荐 这 样 使 用 : 一 方面 这 样 会 降低 代码 的 可 读 
性 ,有 时 很 难 区 分 自 定义 函数 和 从 模块 中 导入 的 函数 ; 另 一 方面 ,这 种 导入 对 象 的 方式 
将 会 导致 命名 空间 的 混乱 。 如 果 多 个 模块 中 有 同名 的 对 象 ,只 有 最 后 一 个 导入 的 模块 
中 的 对 象 是 有 效 的 ,而 之 前 导 和 人 的 模块 中 的 同名 对 象 都 将 无 法 访问 ,不 利于 代码 的 理 
解 和 维护 。 

















1.7 _name 属性 的 作用 


除了 可 以 在 开发 环境 或 命令 提示 符 环境 中 直接 运行 ,任何 Python 程序 文件 都 可 以 
作为 模块 导入 并 使 用 其 中 的 对 象 ,这 也 是 实现 代码 复 用 的 重要 形式 。 通 过 Python 程序 
的 _name__ 属 性 可 以 识别 程序 的 使 用 方式 ,每 个 Python 脚本 在 运行 时 都 会 有 一 个 
__name__ 属 性 ,如 果 脚 本 作为 模块 被 导入 , 则 其 _name__ 属 性 的 值 被 自动 设置 为 模块 名 ; 
如 果 脚 本 作为 程序 直接 运行 , 则 其 __name__ 属 性 值 被 自动 设置 为 字符 串 ，_main__'。 例 
如 ,假设 程序 hello. py 中 的 代码 如 下 : 


def main(): #def 是 用 来 定义 函数 的 Python 关 键 字 
if_ _ name ==' min _': # 选 择 结构 ,识别 当前 的 运行 方式 
Print ("This Program is run directly.') 
elif _ name == 'hello': # 冒 号 ,换行 、 缩 进 表示 一 个 语句 块 的 开始 


Print ("This Program is used as a module.') 


main() # 调 用 上 面 定义 的 函数 
那么 通过 任何 方式 直接 运行 该 程序 时 都 会 得 到 下 面 的 结果 : 
This program is run directly. 
而 在 使 用 import hello 导入 该 模块 时 ,得 到 结果 如 下 : 


This program is used as a mdule. 


本 章 小 结 


(1) Python 是 一 门 通用 编程 语言 ,也 是 一 门 跨 平 台 、 开 源 、 免 费 的 解释 型 高 级 动态 编 
程 语言 。 

(2) Python 程序 可 以 伪 编 译 成 字 节 码 , 也 可 以 打包 成 为 二 进 制 可 执行 文件 。 

(3) Python 支持 命令 式 编程 和 函数 式 编程 ,支持 面向 对 象 程序 设计 。 

(4) Python 3.x 的 全 面 普及 是 大 势 所 趋 。 

(5) Python 程序 对 缩 进 的 要 求 非常 高 ,对 代码 可 读 性 要 求 非 常 高 。 

(6) Anaconda3 是 目前 比较 流行 的 Python 开发 环境 。 
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习 题 


1.1 到 Python 官方 网 站 下 载 并 安装 Python 解释 器 环境 。 
1.2 到 Anaconda 官方 网 站 下 载 并 安装 最 新 的 Anaconda3 开发 环境 。 
1.3 Python 程序 的 _name__ 属 性 的 作用 是 什么 ? 


i 
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达 式 与 内 置 对 象 


Python 常用 内 置 对 象 


对 象 是 Python 中 最 基本 的 概念 之 一 ,在 Python 中 一 切 都 是 对 象 ,除了 整数 ,实数 、 


复数 .字符 串 、 列 表 、 元 组 字典、 集合 外 ,还 有 zip .map、enumerate ,filter 等 对 象 ,函数 和 类 
也 是 对 象 。 常 用 的 Python 内 置 对 象 如 表 2-1 所 示 。 
































表 2-1 常用 的 Python 内 置 对象 
对 象 类 型 类 型 名 称 示 例 简要 说 明 
数字 int, float, 1234,3.14, 1. 3e5, 3 十 4 数字 大 小 没有 限制 ,内 置 支持 复数 及 其 
complex 运算 
i, he wd 使 用 单 引 号 、 双 引号 、 三 引号 作为 定 界 
字符 串 str "| 符 ,以 字母 + 或 R 引导 的 表示 原始 字 
"Python ", rabc', Rbcd' 符 帅 
以 字母 b 引导 ,可 以 使 用 单 引 号 、 双 引 
字 节 串 bytes b'hello world 号 .三 引号 作为 定 界 符 
所 有 元 素 放 在 一 对 方 括号 中 ,元 素 之 间 
列表 list [1, 2, 3],[a', b', ['e', 2]] | 使 用 逗号 分 隔 , 其 中 的 元 素 可 以 是 任意 
类 型 
字典 dt {1: 'food' ,2: 'taste '，3; | 所 有 元 素 放 在 一 对 大 括号 中 ,元 素 之 间 
mporty 使 用 逗号 分 隔 ,元 素 形式 为 " 键 : 值 " 
所 有 元 素 放 在 一 对 圆 括号 中 ,元 素 之 间 
元 组 tuple (25 一 5 6), 3)》 使 用 逗号 分 隔 ,如 果 元 组 中 只 有 一 个 元 
素 的 话 ,后面 的 逗号 不 能 省 略 
所 有 元 素 放 在 一 对 大 括号 中 ,元 素 之 间 
集合 | 使 用 逗号 分 隔 ,元 素 不 允许 重复 ;另外 ， 
Ee set 是 可 变 的 ,而 frozenset 是 不 可 变 的 
逻辑 值 ,关系 运算 符 \ 成 员 测 试 运算 符 、 
布尔 型 bool True, False 同一 性 测试 运算 符 组 成 的 表达 式 的 值 一 
般 为 True 或 False 
空 类 型 NoneType | None 空 值 
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续 表 
对 象 类 型 类 型 名 称 示 例 简要 说 明 
Exception 
异常 ValueError Python 内 置 大 量 异常 类 ,分 别 对 应 不 同 
TypeError 类 型 的 异常 
时 ， ys open 是 Python 的 内 置 函 数 , 使 用 指定 的 
文件 {=open('data. dat', rb’) 模式 打开 文件 ,返回 文件 对 象 
生成 器 对 象 .range 对 象 .zip 
其 他 迭代 对 象 对 象 、enumerate 对 象 、map | 具有 惰性 求 值 的 特点 
对 象 ,filter 对 象 等 
类 和 函数 都 属于 可 调用 对 象 ,模块 用 来 
模块 (类 型 为 module) 集中 存放 函数 、 类 、 常 量 或 其 他 对 象 
211 常量 与 变量 


在 表 2-1 中 ,第 3 列 的 示例 除了 最 后 4 行 之 外 ,其 他 都 是 合法 的 Python 常量 。 所 谓 
常量 ,一 般 是 指 不 需要 改变 也 不 能 改变 的 字面 值 , 如 一 个 数字 3, 又 如 一 个 列表 [1,2,3]， 
都 是 常量 。 与 常量 相反 ,变量 的 值 是 可 以 变化 的 ,这 一 点 在 Python 中 更 是 体现 得 淋漓 尽 
致 。 在 Python 中 ,不 需要 事先 声明 变量 名 及 其 类 型 ,直接 赋值 即 可 创建 任意 类 型 的 对 象 
变量 。 不 仅 变 量 的 值 是 可 以 变化 的 ,变量 的 类 型 也 是 随时 可 以 发 生 改变 的 。 例 如 ,下 面 第 
一 条 语句 创建 了 整 型 变量 x, 并 赋值 为 3。 


>>> 三 3 


>>> type (x) 


< class 'int'> 
>>> type (x)== int 


True 


>>> isinstance (x, int) 


True 


# 整 型 变量 


# 内 置 函数 type0 用 来 查看 变量 类 型 


# 内 置 函 数 isinstance() 用 来 测试 变量 是 否 为 指定 类 型 


下 面 的 语句 创建 了 字符 串 变 量 x, 并 赋值 为 "Hello world.', 之 前 的 整 型 变量 x 不 复 


存在 。 


>>> 区 "Hello world. 


下 面 的 语句 创建 了 列表 对 象 x, 并 赋值 为 [1, 2, 3] ,之 前 的 字符 串 变量 x 也 就 不 再 存 
在 了 。 这 一 点 同样 适用 于 元 组 字典、 集合 和 其 他 Python 任意 类 型 的 对 象 ,包括 自 定义 


类 型 的 对 象 。 


>>>z= [1,2,3] 


Python 采用 基于 值 的 内 存 管 理 模式 。 赋 值 语句 的 执行 过 程 是 : 首先 把 等 号 右 侧 表 


# 字 符 串 变 量 
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达 式 的 值 计算 出 来 ,然后 在 内 存 中 寻找 一 个 位 置 把 值 存放 进去 ,最 后 创建 变量 并 指向 这 个 
内 存 地 址 。Python 中 的 变量 并 不 直接 存储 值 ,而 是 存储 了 值 的 内 存 地 址 或 者 引用 ,这 也 
是 变量 类 型 随时 可 以 改变 的 原因 。 

虽然 不 需要 在 使 用 之 前 显 式 地 声明 变量 及 其 类 型 ,但 Python 是 一 种 不 折 不 扣 的 强 类 
型 编程 语言 ,Python 解释 器 会 根据 赋值 运算 符 右 侧 表达 式 的 值 来 自动 推断 变量 类 型 。 其 
工作 方式 类 似 于 “状态 机 ”, 变 量 被 创建 以 后 ,除非 显 式 修改 变量 类 型 或 删除 变量 ,否则 变 
量 将 一 直 保持 之 前 的 类 型 。 

如 果 变 量 出 现在 赋值 运算 符 或 复合 赋值 运算 符 ( 如 十 三 、*x 二 等 ) 的 左边 则 表示 创建 
变量 或 修改 变量 的 值 ,否则 表示 引用 该 变量 的 值 ,这 一 点 同样 适用 于 使 用 下 标 来 访问 列 
表 、 字 典 等 可 变 序 列 以 及 自 定义 对 象 中 元 素 的 情况 。 例 如 : 


>>> 王 3 # 创 建 整 型 变量 

>>> print (xx2) # 访 问 变量 的 值 

9 

>>>x+=6 ## 修 改变 量 的 值 

>>>z= [1,2,3] # 创 建 列表 对 象 
>>>x[1]=5 # 修 改 列表 元 素 值 

>>> print (x) # 输 出 显示 整个 列表 
[1,5,3] 

>>> print (x[2]) # 输 出 显示 列表 指定 元 素 


3 

在 Python 中 定义 变量 名 时 ,需要 注意 以 下 问题 。 

(1) 变量 名 必须 以 字母 或 下 夯 线 开头 ,但 以 下 夯 线 开头 的 变量 在 Python 中 有 特殊 含 
义 ,请 参考 第 6 章 内 容 。 

(2) 变量 名 中 不 能 有 空格 或 标点 符号 (括号 .引号 .逗号 、 斜 线 、 反 和 斜 线 .冒号 、 句 号. 问 
号 等 ) 。 

(3) 不 能 使 用 关键 字 作 为 变量 名 ,Python 关键 字 的 介绍 请 见 2. 3 节 。 要 注意 的 是 ， 
随 着 Python 版 本 的 变化 ,关键 字 列 表 可 能 会 有 所 变化 。 

(4) 不 建议 使 用 系统 内 置 的 模块 名 、 类 型 名 或 函数 名 以 及 已 导入 的 模块 名 及 其 成 员 
名 作为 变量 名 ,这 会 改变 其 类 型 和 含义 ,甚至 会 导致 其 他 代码 无 法 正常 执行 。 可 以 通过 
dir(__builtins__) 查 看 所 有 内 置 对 象 名 称 。 

(5) 变量 名 对 英文 字母 的 大 小 写 敏感 ,如 student 和 Student 是 不 同 的 变量 。 


212 数字 


在 Python 中 ,内 置 的 数字 类 型 有 整数 .实数 和 复数 ,借助 于 标准 库 fractions 中 的 
Fraction 对 象 可 以 实现 分 数 及 其 运算 ,而 fractions 中 的 Decimal 类 则 实现 了 更 高 精度 的 

1. 内 置 的 整数 .实数 与 复数 

Python 支持 任意 大 的 数字 ,具体 可 以 大 到 什么 程度 仅 受 内 存 大 小 的 限制 。 由 于 精度 
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的 问题 ,对 于 实数 运算 可 能 会 有 一 定 的 误差 ,应 尽量 避免 在 实数 之 间 直 接 进行 相等 性 测 
试 ,而 是 应 该 以 两 者 之 差 的 绝对 值 是 否 足够 小 作为 两 个 实数 是 否 相等 的 依据 。 在 数字 的 
算术 运算 表达 式 求 值 时 会 进行 隐 式 的 类 型 转换 ,如 果 存在 复数 则 都 变 成 复数 ,如 果 没 有 复 
数 但 是 有 实数 就 都 变 成 实数 ,如 果 都 是 整数 则 不 进行 类 型 转换 。 


>>> 9999 xx# 99 # 这 里 ** 是 寡 乘 运算 符 , 等 价 于 内 置 函 数 pow() 
9901483535267234876022631247532826255705595288957910573243265291217948378940535 
1346442217682691643393258692438667776624403200162375682140043297505120882020498 
0098735552703841362304669970510691243800218202840374329378800694920309791954185 
1177984343295912121591062986999386699080675733747243312089424255448939109100732 
05049031656789220889560732962926226305865706593594917896276756396348514900989999 


>>> 0.3+ 0.2 # 实 数 相 加 

0.5 

>>> 0.4 -0.1 # 实 数 相 减 , 结 果 稍 微 有 点 偏差 
0.30000000000000004 

>>>0.4- 0. 二 =0.3 # 应 尽量 避免 直接 比较 两 个 实数 是 否 相等 
False 

>>>abs(0.4- 0.1 -0.3)<le-6 # 这 里 le- 6 表示 10 的 -6 次 方 

True 

Python 内 置 支持 复数 类 型 及 其 运算 ,并 且 形 式 与 数学 上 的 复数 完全 一 致 。 例 如 : 
>>> 闻 3 # 使 用 j 或 J 表示 复数 虚 部 

>>> 产 夺回 

>>>xty # 支 持 复数 之 间 的 加 , 减 、 乘 、 除 以 及 竹 乘 等 运算 
(8+ 10j) 

>>>xx*y 

(- 9+ 38j) 

>>> abs (x) # 内 置 函 数 abs() 可 用 来 计算 复数 的 模 
5.0 

>>> x.imag # 虚 部 

4.0 

>>> X.Teal # 实 部 

3.0 

>>>x.conjugate() # 共 因 复 数 

(G- 和) 


Python 3. 6.x 支 持 在 数字 中 间 位 置 使 用 单个 下 画 线 作为 分 隔 来 提高 数字 的 可 读 性 ， 
类 似 于 数学 上 使 用 逗号 作为 千 位 分 隔 符 。 在 Python 数字 中 单个 下 画 线 可 以 出 现在 中 间 
任意 位 署 , 但 不 能 出 现在 开头 和 结尾 位 置 , 也 不 能 使 用 多 个 连续 的 下 画 线 。 

>>>1 000 000 

1000000 a 

FE 

ee 
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>>>1 2+3 要 
(12+ 34) 

>>>1 2.3 45 
12.345 


2. 分 数 


Python 标准 库 fractions 中 的 Fraction 对 象 支持 分 数 运算 ,还 提供 了 用 于 计算 最 大 公 
约 数 的 gcdO 〇 函数 和 高 精度 实数 类 Decimal, 这 里 重点 介绍 Fraction 对 象 。 


>>> fram fractions import Fraction 

>>> = Fraction(3,5) # 创 建 分 数 对 象 

>>> 5 Fraction(3,7) 

>>>x 

Fraction(3,5) 

>>>x*#x*2 # 短 运算 

Eraction (9,25) 

>>> x.numerator # 查 看 分 子 

3 

>>>x.dencminator # 查 看 分 母 

5 

>>>xty # 支 持 分 数 之 间 的 四 则 运算 ,自动 进行 通 分 
Fraction (36, 35) 

>>>x-y 

Eraction (6,35) 

>>>xx 

Eraction (9,35) 

>>>x/y 

Fraction(7,5) 

>>>x* 2 # 分 数 与 数字 之 间 的 运算 
Eraction (6,5) 

>>> Fracticn (3.5) # 把 实数 转换 为 分 数 


Eraction (7,2) 


3. 高 精度 实数 
标准 库 fractions 和 decimal 中 提供 的 Decimal 类 实现 了 更 高 精度 的 运算 。 


>>> fram fractions jimport Decimal 


>>> 1/9 # 内 置 的 实数 类 型 
0.1111111111111111 

>>> Decimal (1/9) # 高 精度 实数 

Decimal ("0.111111111111111104943205418749130330979824066162109375") 
>>> 3 


0.3333333333333333 
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>>> Decimal (1/3) 

Decimal ('0.333333333333333314829616256247390992939472198486328125") 
>>> Decimal (1/9)+ Decimal (1/3) 

Decimal ("0.4444444444444444197728216750") 


213 字符 串 与 字 节 是 


在 Python 中 ,没有 字符 常量 和 变量 的 概念 ,只 有 字符 串 类 型 的 常量 和 变量 ,单个 字 
符 也 是 字符 串 。 使 用 单 引 号 、 双 引号 、 三 单 引 号 、 三 双 引 号 作为 定 界 符 (delimiter) 来 表示 
字符 串 , 并 且 不 同 的 定 界 符 之 间 可 以 互相 嵌 套 。Python 3. x 全 面 支持 中 文 ,中 文 和 英文 字 
母 都 作为 一 个 字符 对 待 ,甚至 可 以 使 用 中 文 作为 变量 名 。 除 了 支持 使 用 加 号 运算 符 连接 
字符 串 以 外 ,Python 字符 串 还 提供 了 大 量 的 方法 支持 查找 、 蔡 换 、 排 版 等 操作 。 很 多 内 置 
函数 和 标准 库 对 象 也 都 支持 对 字符 串 的 操作 ,对 此 将 在 第 7 章 进行 详细 介绍 。 这 里 先 简 
单 介绍 一 下 字符 串 对 象 的 创建 和 连接 。 


>>> x 'Hello world." # 使 用 单 引 号 作为 定 界 符 

>>> 区 "Python is a great language." # 使 用 双 引 号 作为 定 界 符 

>>> 区 ' Tom said, "Let's go # 不 同 定 界 符 之 间 可 以 互相 嵌 套 
>>> print (x) 

Tem said, "Tet's go." 

>>> 2 'good '+ morning'" # 连 接 字符 串 

>>>x 

,good moming’ 

>>> x 'good 'morning'" # 连 接 字 符 串 , 仅 适 用 于 字符 串 常量 
>>>x 

‘1good moming' 

>>> 闻 "good ' 

>>> 区 xmopming'" # 不 适用 于 字符 串 变 量 

SyntaxError: invalid syntax 

>>> x+ ‘moming' # 字 符 串 变量 之 间 的 连接 可 以 使 用 加 号 
2 

good moming’ 


Python 3. x 除了 支持 Unicode 编码 的 str 类 型 字符 串 之 外 ,还 支持 字 节 串 类 型 
bytes。 对 str 类 型 的 字符 串 调用 其 encode() 方 法 进行 编码 得 到 bytes 字 节 串 ,对 bytes 字 
节 串 调用 其 decode( ) 方 法 并 指定 正确 的 编码 格式 则 得 到 str 字符 串 。 例 如 : 


>>> type('Hello world') # 默 认 字符 串 类 型 为 str 

< class 'str'> 

>>> type b'Hello world) # 在 定 界 符 前 加 上 字母 b 表 示 字 节 串 
< class "bytes'> 

>>> 'Hello world' .encode (‘utf- 89) # 使 用 UIE- 8 编码 格式 进行 编码 
b'Hello world' 


>>> 'Hello world' .encode ('gok') # 使 用 gok 编 码 格 式 进行 编码 
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属 
b'Hello world' 
>>> ' 董 付 国 '.encoge ("utf- 8') 
b'\xe8\x91\xa3\xeA\ xtb\x98\xe5\xP\xbd' 


# 对 中 文 进行 编码 


>>>_.decode ("utf- 8') 


# 一 个 下 画 线 表示 最 后 一 次 正确 输出 结果 


' 董 付 国 ' 

>>> ' 董 付 国 '.encode ('gok') 
b'\xb6\xad\xb8\xb6\ xbN\xfa' 
>>> _.decode ('gok') 

' 董 付 国 ' 


214 列表 、 元 组 .字典 、 集 合 


# 对 bytes 字 节 串 进行 解码 


列表 、 元 组 .字典 和 集合 是 Python 中 常用 的 序列 类 型 ,很 多 复杂 的 业务 逻辑 最 终 还 
是 由 这 些 基 本 数据 类 型 来 实现 。 表 2-2 比较 了 这 几 种 结构 的 区 别 。 


表 2-2 列表 、 元 组 字典、 集合 的 对 比 


















































比较 项 列 表 元 组 字 典 集 合 
类 型 名 称 list tuple dict set 
定 界 符 方 括号 [] 圆 括号 () 大 括号 {} 大 括号 {} 
是 否 可 变 是 否 是 是 
是 否 有 序 是 是 否 否 
= 是 (使 用 序号 作为 | 是 (使 用 序号 作为 下 | 是 (使 用 * 键 "作为 
di 下 标 ) 标 ) 下 标 ) 要 
元 素 分 隔 符 逗号 逗号 逗号 逗号 
对 元 素 形式 的 要 求 ”| 无 无 键 : 值 必须 可 哈 希 
对 元 素 值 的 要 求 无 无 “ 键 " 必 须 可 哈 希 “| 必须 可 哈 希 
到 “ 键 " 不 允许 重复 ， 
元 素 是 否 可 重复 是 是 “ 值 * 可 以 重复 否 
元 素 查 找 速度 非常 慢 很 慢 非常 快 非常 快 
尾部 操作 快 ,其 他 

新 增 和 删除 元 素 速度 位 置 慢 不 允许 快 快 

下 面 的 代码 简单 演示 了 这 儿 种 对 象 的 创建 与 使 用 ,更 详细 的 介绍 请 参考 第 3 章 。 

>>> x _list= [1,2,3 # 创 建 列表 对 象 

>>>x tuple= (1,2,3) # 创 建 元 组 对 象 

>>>x dict= {'a':9, 'b':98, 'c':99} # 创 建 字典 对 象 

>>>x set= {1,2,3} # 创 建 集合 对 象 

>>>print (x 1ist[1]) # 使 用 下 标 访问 指定 位 置 的 元 素 

2 

>>>print (x tuple[1]) # 元 组 也 支持 使 用 序号 作为 下 标 


2 
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>>>print (x dict['a']) # 字 典 对 象 的 下 标 是 “ 键 ” 
9 

>>>3 inx set # 成 员 测 试 

True 


除了 这 几 种 结构 之 外 ,前 面 介 绍 的 字符 串 也 具有 相似 的 操作 , 详 见 第 7 章 。 另 外 ， 
Python 还 提供 了 range、map、zip、filter、enumerate、reversed 等 大 量 迁 代 对 象 (迭代 对 象 
可 以 理解 为 表示 数据 流 的 对 象 , 每 次 返回 一 个 数据 )。 这 些 和 迭代 对 象 大 多 具有 与 Python 
序列 相似 的 操作 方法 ,比较 大 的 区 别 在 于 这 些 迁 代 对 象 大 多 具有 惰性 求 值 的 特点 , 仅 在 需 
要 时 才 给 出 新 的 元 素 , 减 少 了 对 内 存 的 占用 , 详 见 2.4 节 。 


2.2 Python 运算 符 与 表达 式 


Python 是 面向 对 象 的 编程 语言 ,在 Python 中 一 切 都 是 对 象 。 对 象 由 数据 和 行为 两 
部 分 组 成 ,而 行为 主要 通过 方法 来 实现 ,通过 一 些 特殊 方法 的 重 写 , 可 以 实现 运算 符 重 载 。 
运算 符 也 是 表现 对 象 行为 的 一 种 形式 ,不 同类 的 对 象 支持 的 运算 符 有 所 不 同 ,同一 种 运算 
符 作 用 于 不 同 的 对 象 时 也 可 能 会 表现 出 不 同 的 行为 ,这 正 是 “多 态 "的 体现 。 

在 Python 中 ,单个 常量 或 变量 可 以 看 作 最 简单 的 表达 式 ,使 用 除 赋值 运算 符 之 外 的 
其 他 任意 运算 符 和 函数 调用 连接 的 式 子 也 属于 表达 式 。 

除了 算术 运算 符 、 关 系 运 算 符 、. 迎 辑 运算 符 及 位 运算 符 等 常见 运算 符 之 外 ,Python 还 
支持 一 些 特 有 的 运算 符 ,如 成 员 测 试 运算 符 、 集 合 运 算 符 、 同 一 性 测试 运算 符 等 。 使 用 时 
需 注意 ,Python 很 多 运算 符 具有 多 种 不 同 的 含义 ,作用 于 不 同 对 象 时 的 含义 并 不 完全 相 
同 ,非常 灵活 。 常 用 的 Python 运算 符 如 表 2-3 所 示 , 运 算 符 优先 级 遵循 的 规则 为 : 算术 
运算 符 的 优先 级 最 高 ,其 次 是 位 运算 符 、 成 员 测试 运算 符 、 关 系 运 算 符 、 逻 辑 运 算 符 等 , 算 
术 运 算 符 遵 循 “ 先 乘除 ,后 加 减 ” 的 基本 运算 原则 。 虽 然 Python 运算 符 有 一 套 严格 的 优 
先 级 规则 ,但 是 强烈 建议 在 编写 复杂 表达 式 时 使 用 圆 括号 说 明 其 中 的 逻辑 来 提高 代码 可 
读 性 。 记 住 , 圆 括号 是 明确 和 改变 表达 式 运 算 顺序 的 利器 ,在 适当 的 位 置 使 用 圆 括号 可 以 
使 得 表达 式 的 含义 更 加 明确 。 














表 2-3 ”Python 运算 符 


























运 算 符 功能 说 明 
过 算术 加 法 ,列表 、 元 组 ,字符 串 合 并 与 连接 , 正 号 
算术 减法 ,集合 差 集 , 相 反 数 
六 算术 乘法 ,序列 重复 
/ 真 除法 
// 求 整 商 ,如 果 操 作 数 中 有 实数 ,结果 为 实数 形式 的 整数 
% 求 余数 ,字符 串 格式 化 
六 徊 运算 











18 8 Python 程序 设计 基础 (第 2 版 ) 



































SS 
续 表 
运 算 符 功能 说 明 
i ( 值 ) 大 小 比较 ,集合 的 包含 关系 比较 
or 逻辑 或 
and 逻辑 与 
not 逻辑 非 
in 成 员 测 试 
is 对 象 同一 性 测试 , 即 测试 是 否 为 同一 个 对 象 或 内 存 地 址 是 否 相同 
有 位 或 .位 异 或 .位 与 . 左 移 位 、 右 移 位 、 位 求 反 
和 |、 集合 交集 、 并 集 、 对 称 差 集 
@ 矩阵 相 乘 运算 符 
221 算术 运算 符 


(1) 十 运算 符 除 了 用 于 算术 加 法 以 外 ,还 可 以 用 于 列表 ,元 组 ,字符 串 的 连接 ,但 不 支 
持 不 同类 型 的 对 象 之 间 相 加 或 连接 。 


>>> [1,2,3]+ [4,5,6] # 连 接 两 个 列表 

[1,2,3,4,5,6] 

>>> (1,2,3)+ (4,) # 连 接 两 个 元 组 

(1,2,3,4) 

>>> 'abod'+ '1234" # 连 接 两 个 字符 串 

vabodl234 

>>> 'A'+1 # 不 支持 字符 与 数字 相 加 , 抛 出 异常 
TypeError: Can't oonvert 'int' cbject to str implicitly 

>>> Truet 3 # Python 内 部 把 rrue 当 作 1 处 理 
4 

>>> Falset 3 # 把 False 当 作 0 处 理 


3 


(2) * 运算 符 除 了 表示 算术 乘法 ,还 可 用 于 列表 、 元 组 .字符 串 这 几 个 序列 类 型 与 整 
数 的 乘法 ,表示 序列 元 素 的 重复 ,生成 新 的 序列 对 象 。 字 典 和 集合 不 支持 与 整数 的 相 乘 ， 


因为 其 中 的 元 素 是 不 允许 重复 的 。 
>>>True* 3 
3 
>>> False* 3 


>>> [1,2,3]* 3 
[1,2,3,1,2,3,1,2,3] 
>>> (1,2,3)*3 





第 2 章 万 丈 高 楼 平地 起 : 运算 符 、 表 达 式 与 内 置 对 象 多 
® 


(1,2,3,1,2,3,1,2,3) 

>>> 'abc'x 3 

'abcabcabc' 

(3) 运算 符 / 和 // 在 Python 中 分 别 表示 算术 除法 和 算术 求 整 商 (floor division)。 
>>>3/2 # 数 学 意义 上 的 除法 

1.5 

>>>15//4 # 如 果 两 个 操作 数 都 是 整数 ,结果 为 整数 

a 

>>>15.0// 4 # 如 果 操 作 数 中 有 实数 ,结果 为 实数 形式 的 整数 值 
3.0 

>>>-15//4 # 向 下 取 整 


-4 


(4) %% 运 算 符 可 以 用 于 整数 或 实数 的 求 余数 运算 ,还 可 以 用 于 字符 串 格式 化 ,但 是 并 
不 推荐 这 种 用 法 ,关于 字符 串 格式 化 的 详细 介绍 请 参考 第 7 章 。 


>>> 789$ 23 # 余 数 

7 

>>> 123.45%3.2 # 可 以 对 实数 进行 余数 运算 ,注意 精度 问题 
1.849999999999996 

>>> '% c,d' % (65,65) # 把 65 分 别 格式 化 为 字符 和 整数 
‘A,65! 

>>> '%f£,%3"' % (65,65) # 把 65 分 别 格式 化 为 实数 和 字符 串 
"65.000000, 65" 

(5) xx 运 算 符 表示 竹 乘 ,等 价 于 内 置 函 数 pow()。 例 如 : 

>>> 3 xx#2 #3 的 2 次 方 ,等 价 于 pow(3,2) 

9 

>>> pow (3,2,8) # 等 价 于 Gex2)88 

1 

>>> gex0.5 #9 的 0.5 次 方 , 即 9 的 平方 根 

3.0 

>>> (- 9)*x*0.5 # 可 以 计算 负数 的 平方 根 


(1.8369701987210297e- 16+ 3j) 


222 关系 运算 符 


Python 关系 运算 符 可 以 连用 ,其 含义 与 人 们 日 常 的 理解 完全 一 致 。 使 用 关系 运算 符 
的 一 个 最 重要 的 前 提 是 ,操作 数 之 间 必 须 可 比较 大 小 。 例 如 ,把 一 个 字符 串 和 一 个 数字 进 
行 大 小 比较 是 毫 无 意义 的 ,所 以 Python 也 不 支持 这 样 的 运算 。 


>>>1l<3c<5 # 等 价 于 lj<3 and 3<5 
True 
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S 
>>>3<5>2 
True 
>>>1> 8 
False 
>>> D> & math.sqrt (9) # 具 有 惰性 求 值 或 者 逻辑 短路 的 特点 
False 
>>> < & math.saqrt (9) # 还 没有 导入 math 模 块 , 抛 出 异常 
NEmegrror: name "math' is not defined 
>>> import math 
>>> I< &K math.sqrt (9) 
False 
>>> 'Hello'> "world" # 比较 字符 串 的 大 小 
False 
>>> [1,2,3]< [1,2,4] # 比 较 列 表 的 大 小 
True 
>>> 'Hello'>3 # 字 符 串 和 数字 不 能 比较 
TypeError: unorderable types: str()> int() 
>>> {1,2,3}< {1,2,3,4} # 测 试 是 否 子 集 
True 
>>> {1,2,3}== {3,2,1} # 测 试 两 个 集合 是 否 相等 
True 
>>> {1,2,4}> {1,2,3} # 集 合 之 间 的 包含 测试 
False 
>>> {1,2,4}< {1,2,3} 
False 
>>> {1,2,4}== {1,2,3} 
False 


223 成 员 测试 运算 符 in 与 同一 性 测试 运算 符 is 
成 员 测试 运算 符 in 用 于 成 员 测试 , 即 测试 一 个 对 象 是 否 为 另 一 个 对 象 的 元 素 。 


>>>3 in [1,2,3] # 测 试 3 是 否 存在 于 列表 [1,2,3] 中 
True 
>>> 5 in range(1,10,1) # range() 是 用 来 生成 指定 范围 数字 的 内 置 函 数 
True 
>>> 'abc' in 'abodefg' # 子 字符 串 测试 
True 
>>> for i in (3,5,7): # 循 环 , 成 员 遍 历 
Print (i,end= \t') 
E 汪 


同一 性 测试 运算 符 (identity comparison)is 用 来 测试 两 个 对 象 是 否 同一 个 ,如 果 是 则 
返回 True, 否 则 返回 False。 如 果 两 个 对 象 是 同一 个 ,两 者 具有 相同 的 内 存 地 址 。 
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>>>3is3 

True 

>>> = [300, 300, 300] 
>>> x[0] is x[1] 
True 

>>> [1,2,3] 
>>>y [1,2,3] 
>>>xisy 
False 

>>> x[0] is y[0] 
True 

>>> x.append (4) 
>>>x 

[1,2,3,4] 

>>>y 

[1,2,3] 

>>>y 

>>>x isy 

True 

>>> x.append (4) 
>>>x 

[1,2,3,4] 

>>>y 

[1,2,3,4] 


224 位 运算 符 与 集合 运算 符 


# 基 于 值 的 内 存 管理 ,同一 个 值 在 内 存 中 只 有 一 份 


# 上 面 形式 创建 的 x 和 y 不 是 同一 个 列表 对 象 


# 不 影响 列表 y 的 值 


#x 和 Y 指 向 同一 个 对 象 


# 对 x 进行 操作 会 对 y 造 成 同样 的 影响 


位 运算 符 只 能 用 于 整数 ,其 内 部 执行 过 程 为 : 首先 将 整数 转换 为 二 进 制 数 ,然后 右 对 
齐 ,必要 时 左 侧 补 0, 按 位 进行 运算 ,最 后 再 把 计算 结果 转换 为 十 进 制 数字 返回 。 位 与 运 


算 规 则 为 1&1=1、1&0 二 0&1 二 0&0 二 


0, 位 或 运算 规则 为 111==110==011 二 1、010=0, 位 异 


或 运算 规则 为 11 二 0^0 二 0、1^*0 二 0 和 1 二 1。 另 外 , 左 移 位 时 右 侧 补 0, 每 左 移 一 位 相当 于 乘 以 
2; 右 移 位 时 左 侧 补 0, 每 右 移 一 位 相当 于 整除 以 2。 


>>> x<2 
12 
>>>3&7 
3 
>>>318 
11 
DI*s 
6 


# 把 3 左 移 2 位 


# 位 与 运算 


# 位 或 运算 


# 位 异 或 运算 


集合 的 交集 、 并 集 、 对 称 差 集 等 运算 借助 于 位 运算 符 来 实现 ,而 差 集 则 使 用 减 号 运算 


符 实现 (注意 ,并 集运 算 符 不 是 加 号 )。 
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S 
>>> {1,2,3} | {3,4,5} # 并 集 ,自动 去 除 重复 元 素 
{1,2,3,4,5} 
二 人 本 考 交集 
{3} 
>>> {1,2,3} ~ {3,4,5} # 对 称 差 集 
{1,2,4,5} 
>>> {1,2,3} - {3,4,5} # 差 集 
{1,2} 

225 网 辑 运 算 符 


逻辑 运算 符 and、or、not 常用 来 连接 条 件 表 达 式 构成 更 加 复杂 的 条 件 表 达 式 ,并 且 
and 和 or 具有 情 性 求 值 或 逻辑 短路 的 特点 , 当 连 接 多 个 表达 式 时 只 计算 必须 要 计算 的 
值 。 例 如 ,表达 式 expl and exp2 等 价 于 expl if not expl else exp2, 而 表达 式 expl or 
exp2 则 等 价 于 expl if expl else exp2。 在 编写 复杂 条 件 表达 式 时 充分 利用 这 个 特点 , 合 
理 安排 不 同 条 件 的 先后 顺序 ,在 一 定 程度 上 可 以 提高 代码 的 运行 速度 。 另 外 要 注意 的 是 ， 
运算 符 and 和 or 并 不 一 定 会 返回 True 或 False, 而 是 得 到 最 后 一 个 被 计算 的 表达 式 的 值 ， 
但 是 运算 符 not 一 定 会 返回 True 或 False。 


>>>3>5anda>3 # 注 意 , 此 时 并 没有 定义 变量 a 

False 

>>>P> 5ora>3 #3>5 的 值 为 False, 所 以 需要 计算 后 面 的 表达 式 
NameError: name 'a' is not defined 

>>>3<5ora>3 #3<5 的 值 为 True, 不 需要 计算 后 面 的 表达 式 
True 

>>>3 and 5 # 最 后 一 个 计算 的 表达 式 的 值 作 为 整个 表达 式 的 值 
5 

>>>3 and 5> 2 

True 

>>> 3 not in [1,2,3] # 逻 辑 非 运算 not 

False 

>>>3isnot 5 # not 的 计算 结果 只 能 是 True 或 False 之 一 
True 

>>>not 3 


>>>not 0 


226 算 阵 乘法 运算 符 @ 

从 Python 3. 5 开始 增加 了 一 个 新 的 矩阵 相 乘 运算 符 @, 不 过 由 于 Python 没有 内 置 
的 矩阵 类 型 ,所 以 该 运算 符 常 与 扩展 库 numpy 一 起 使 用 。 另 外 ,@ 符 号 还 可 以 用 来 表示 
修饰 器 的 用 法 , 详 见 5.1.2 节 。 
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>>> import mnpy #nmmpy 是 用 于 科学 计算 的 Python 扩展 库 

>>> 一 numpy.ones (3) # cnes() 函 数 用 于 生成 全 1 和 矩阵 ,参数 表示 和 矩阵 大 小 
>>>m= numpy.eye(3) * 3 #eye() 函 数 用 于 生成 单位 矩阵 

>>>m[0,2]=5 # 设 置 矩 阵 指定 位 置 上 元 素 的 值 

>>>m[2,0]=3 

>>>x@m # 和 矩阵 相 乘 


array([ 6., 3., 8.]) 


227 补充 说 明 


除了 表 2-3 中 列 出 的 运算 符 之 外 ,Python 还 有 赋值 运算 符 = 和 十 = 一、 一 一 、* 一 
/= //=、*x 一 | 一、 一 等 大 量 复合 赋值 运算 符 。 例 如 ,x 十 = 3 在 语法 上 等 价 (注意 ， 在 
功能 细节 上 可 能 会 稍 有 区 别 , 请 参考 3. 1.4 节 ) 于 x 二 x 十 3, 其 他 复合 赋值 运算 符 与 此 类 
似 , 不 再 著述 。 

Python 不 支持 十 十 和 一 一 运算 符 ,虽然 在 形式 上 有 时 似乎 可 以 这 样 用 ,但 实际 上 是 
另外 的 含义 ,要 注意 和 其 他 语言 的 区 别 。 


>>> 这 3 

>>>++i # 正 正 得 正 , 等 价 于 + (+i) 

3 

>>>+ (+3) # 与 ++i 等 价 

3 

>>> 计 + # Python 不 支持 ++ 运 算 符 ,语法 错误 
SyntaxError: invalid syntax 

>>>--i # 负 负 得 正 , 等 价 于 - (了 

| 

>>>---i # 等 价 于 - (- (C-)) 

专 潭 

>>>i-- # Python 不 支持 -- 运 算 符 ,语法 错误 
SyntaxError: invalid syntax 

人 (3+ 5) 

二 最 

>>>3- -5 # 等 价 于 3 (-5) 

8 

>>>3+-5 # 等 价 于 3+ (-5) 

-2 

>>>3-+5 


2.3 Python 关键 字 简要 说 明 


Python 关键 字 只 允许 用 来 表达 特定 的 语义 ,不 允许 通过 任何 方式 改变 它们 的 含义 ,也 
不 能 用 来 作为 变量 名 、 函 数 名 或 类 名 等 标识 符 。 在 Python 开发 环境 中 导入 模块 keyword 之 
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后 ,可 以 使 用 print(keyword. kwlistb) 查 看 所 有 关键 字 ,Python 关键 字 的 含义 如 表 2-4 所 示 。 


表 2-4 Python 关键 字 的 含义 





关键 字 


高" - 汉 





False 


常量 ,逻辑 假 





None 


常量 , 空 值 





True 


常量 ,逻辑 真 





and 


逻辑 与 运算 符 





as 


在 import 或 except 语句 中 给 对 象 起 别名 





assert 


断言 ,用 来 确认 某 个 条 件 必须 满足 ,可 用 来 帮助 调试 程序 





break 


用 在 循环 中 ,提前 结束 break 所 在 层次 的 循环 





class 


用 来 定义 类 





continue 


用 在 循环 中 ,提前 结束 本 次 循环 





def 


用 来 定义 函数 





del 


用 来 删除 对 象 或 对 象 成 员 





elif 


用 在 选择 结构 中 ,表示 else if 的 意思 





else 


可 以 用 在 选择 结构 .循环 结构 和 异常 处 理 结构 中 





except 


用 在 异常 处 理 结构 中 ,用 来 捕获 特定 类 型 的 异常 





finally 


用 在 异常 处 理 结构 中 ,用 来 表示 不 论 是 否 发 生 异 常 都 会 执行 的 代码 





for 


构造 for 循环 ,用 来 迭代 序列 或 可 迭代 对 象 中 的 所 有 元 素 





明确 指定 从 哪个 模块 中 导入 什么 对 象 ,如 from math import sin; 还 可 以 与 yield 一 起 构成 
yield 表达 式 





定义 或 声明 全 局 变量 





用 在 选择 结构 中 





import 


用 来 导入 模块 或 模块 中 的 对 象 





in 


成 员 测试 





is 


同一 性 测试 





lambda 


用 来 定义 lambda 表达 式 ,类 似 于 函数 





nonlocal 


用 来 声明 nonlocal 变量 





逻辑 非 运算 





逻辑 或 运算 





空 语句 ,执行 该 语句 时 什么 都 不 做 ,常用 作 占 位 符 








用 来 显 式 抛 出 异常 
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关键 字 含义 

return “| 在 函数 中 用 来 返回 值 , 如 果 没 有 指定 返回 值 ,表示 返回 空 值 None 

try 在 异常 处 理 结构 中 用 来 限定 可 能 会 引发 异常 的 代码 块 

while 用 来 构造 while 循环 结构 ,只 要 条 件 表达 式 等 价 于 True 就 重复 执行 限定 的 代码 块 
with 上 下 文 管理 ,具有 自动 管理 资源 的 功能 

yield 在 生成 器 函数 中 用 来 返回 值 























2.4 Python 常用 内 置 函 数 用 法 精 要 


内 置 函数 (built-in functions,BIF) 是 Python 内 置 对 象 类 型 之 一 ,不 需要 额外 导入 任 
何 模块 即 可 直接 使 用 ,这 些 内 置 对 象 都 封装 在 内 置 模块 _builtins_ 之 中 ,用 C 语言 实现 
并 且 进 行 了 大 量 优 化 ,具有 非常 快 的 运行 速度 ,推荐 优先 使 用 。 使 用 内 置 函 数 dir() 可 以 
查看 所 有 内 置 函 数 和 内 置 对 象 : 


>>>dir( builtins ) 

使 用 help( 函 数 名 ) 可 以 查看 某 个 函数 的 用 法 。 另 外 ,也 可 以 不 导入 模块 而 直接 使 用 
help( 模 块 名 ) 查 看 该 模块 的 帮助 文档 ,如 help(math) 。 常 用 内 置 函 数 及 其 功能 简要 说 明 
如 表 2-5 所 示 , 其 中 方 括号 内 的 参数 可 以 省 略 。 


表 2-5 Python 常用 内 置 函数 及 其 功能 简要 说 明 








函 数 功能 简要 说 明 
abs(x) 返回 数字 x 的 绝对 值 或 复数 x 的 模 
如 果 可 和 迭代 对 象 iterable 中 所 有 元 素 x 都 等 价 于 True, 也 就 是 对 于 所 有 
all(iterable) 元 素 x 都 有 bool(x) 等 于 True, 则 返回 True。 对 于 空 的 可 迭代 对 象 也 返 
回 True 





只 要 可 和 迭代 对 象 iterable 中 存在 元 素 x 使 得 bool(x) 为 True, 则 返回 


ee True。 对 于 空 的 可 迁 代 对 象 , 返 回 False 





把 对 象 转换 为 ASCII 码 表 示 形 式 , 必 要 的 时 候 使 用 转 义 字符 来 表示 特定 


ascii(obj) 














的 字符 

bin(x) 把 整数 x 转换 为 二 进 制 串 表 示 形 式 

bool(x) 返回 与 x 等 价 的 布尔 值 True 或 False 

bytes(x) 生成 字 节 串 ,或 把 指定 对 象 x 转换 为 字 节 串 表示 形式 

eallableCobj) 测试 对 象 obj 是 否 可 调用 。 类 和 函数 是 可 调用 的 ,包含 _call__() 方 法 的 
类 的 对 象 也 是 可 调用 的 





complex(real, [imag]) 返回 复数 








chr(x) 返回 Unicode 编码 为 x 的 字符 





.和 
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续 表 





功能 简要 说 明 





dirCobj) 


返回 指定 对 象 或 模块 obj 的 成 员 列表 ,如 果 不 带 参 数 则 返回 当前 作用 域 
内 的 所 有 标识 符 





divmod(x, y) 


返回 包含 整 商 和 余数 的 元 组 ((x 一 x%y)/y, x%y) 





enumerate(iterable[ ,start]) 


返回 包含 元 素 形式 为 (start, iterable[0]), (start 二 1, iterable[1]), (start 
十 2，iterable[2]),，… 的 迭代 器 对 象 ,start 表示 索引 的 起 始 值 











eval(s[，globals[，locals]]) | 计算 并 返回 字符 串 s 中 表达 式 的 值 
exec(x) 执行 代码 或 代码 对 象 x 
exit() 退出 当前 解释 器 环境 





filter(func, seq) 


返回 filter 对 象 ,其 中 包含 序列 seq 中 使 得 单 参数 函数 func 返回 值 为 
True 的 那些 元 素 ,如 果 函 数 func 为 None 则 返回 包含 seq 中 等 价 于 True 
的 元 素 的 filter 对 象 





float(x) 


把 整数 或 字符 串 x 转换 为 浮 点 数 并 返回 


























frozenset([x]) 创建 不 可 变 的 集合 对 象 

globals() 返回 包含 当前 作用 域内 全 局 变量 及 其 值 的 字典 

hash(x) 返回 对 象 x 的 哈 希 值 ,如 果 x 不 可 哈 希 则 抛 出 异常 

help(obj) 返回 对 象 obj 的 帮助 信息 

hex(x) 把 整数 x 转换 为 十 六 进 制 串 

idCobj) 返回 对 象 obj 的 标识 (内 存 地 址 ) 

input([ 提 示 ]) 显示 提示 ,接收 键盘 输入 的 内 容 , 返 回 字符 串 

int(x[，d]) 返回 实数 (float) ,分 数 (Fraction) 或 高 精度 实数 (Decimal) x 的 整数 部 分 ， 


或 把 d 进 制 的 字符 串 x 转换 为 十 进 制 并 返回 ,d 默认 为 十 进 制 





isinstance(obj, class-or- 
type-or-tuple) 


测试 对 象 obj 是 否 属于 指定 类 型 (如 果 有 多 个 类 型 的 话 需 要 放 到 元 组 中 ) 
的 实例 





len(obj) 


返回 对 象 obj 包含 的 元 素 个 数 ,适用 于 列表 ,元 组 集合 、 字 典 、 字 符 串 以 
及 range 对 象 , 不 适用 于 具有 惰性 求 值 特点 的 生成 器 对 象 和 map \zip 等 迭 
代 对 象 





list([x]) set([x]) tuple 
([x]) dict(Lx]) 


把 对 象 x 转换 为 列表 、 集 合 、 元 组 或 字典 并 返回 ,或 生成 空 列表 、 空 集合 、 
空 元 组 \ 空 字典 





locals() 


返回 包含 当前 作用 域内 局 部 变量 及 其 值 的 字典 





map(func, *iterables) 


返回 包含 若干 函数 值 的 map 对 象 ,函数 func 的 参数 分 别 来 自 于 iterables 
指定 的 一 个 或 多 个 迭代 对 象 





max(…) 、min(…) 





返回 多 个 值 中 或 者 包含 有 限 个 元 素 的 可 迭代 对 象 中 所 有 元 素 的 最 大 值 、 
最 小 值 , 要 求 所 有 元 素 之 间 可 比较 大 小 ,允许 指定 排序 规则 ,参数 为 可 和 迭 
代 对 象 时 还 允许 指定 默认 值 
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续 表 





函 数 


功能 简要 说 明 





next(iterator[ ，default]) 


返回 迭代 对 象 x 中 的 下 一 个 元 素 , 允 许 指 定 迭 代 结 束 之 后 继续 迭代 时 返 
回 的 默认 值 





oct(x) 


把 整数 x 转换 为 八进制 串 





open(fn[, mode]) 


以 指定 模式 mode 打开 文件 fn 并 返回 文件 对 象 





ord(x) 


返回 一 个 字符 x 的 Unicode 编码 





pow(x, y, z= None) 


返回 x 的 y 次 方 ,等 价 于 xxxy 或 (xx*xy) % z 





print(value, **, sep="', 
end='\n', file= sys. 


stdout, flush= False) 


基本 输出 函数 ,默认 输出 到 屏幕 , 相 邻 数 据 使 用 空格 分 隔 ,以 换行 符 结束 
所 有 数据 的 输出 





quit() 


退出 当前 解释 器 环境 





range([start,] end [ ,step]) 


返回 range 对 象 ,其 中 包含 左 闭 右 开 区 间 [start,end) 内 以 step 为 步 长 的 
整数 





reduce(func, sequence 
[, initial]) 


将 双 参 数 的 函数 func 以 迭代 的 方式 从 左 到 右 依 次 应 用 至 序列 seq 中 的 每 
个 元 素 ,并 把 中 间 计 算 结果 作为 下 一 次 计算 的 操作 数 之 一 ,最 终 返 回 单个 
值 作为 结果 。 在 Python 2. x 中 该 函数 为 内 置 函数 ,在 Python 3. x 中 需要 
从 functools 中 导入 reduce 函数 再 使 用 





reversed(seq) 


返回 seq( 可 以 是 列表 、 元 组 ,字符 串 .range 等 对 象 ) 中 所 有 元 素 逆 序 后 的 
迭代 器 对 象 ,不 适用 于 具有 惰性 求 值 特点 的 生成 器 对 象 和 map、zip 等 可 
和 迭代 对 象 





round(x[， 小 数位 数 ]) 


对 x 进行 四 舍 五 入, 若 不 指定 小 数位 数 , 则 返回 整数 





sorted(iterable, key= 
None, reverse=False) 


返回 排序 后 的 列表 ,其 中 iterable 表示 要 排序 的 序列 或 迭代 对 象 ,key 用 
来 指定 排序 规则 或 依据 ,reverse 用 来 指定 升序 或 降序 





str(obj) 


把 对 象 obj 直接 转换 为 字符 串 





sum(x, start=0) 


返回 序列 x 中 所 有 元 素 之 和 ,允许 指定 起 始 值 start, 返 回 start 十 sum(x) 





type(obj) 


返回 对 象 obj 的 类 型 





zip(seql [, seq2 [*…]]) 





返回 zip 对 象 ,其 中 元 素 为 (seql[ 让 ,seq2[ 店 ，…) 形 式 的 元 组 ,最 终结 果 


中 包含 的 元 素 个 数 取决 于 所 有 参数 序列 或 可 迭代 对 象 中 最 短 的 那个 


内 置 函 数 数量 众多 且 功 能 强大 ,很 难 一 下 子 全 部 解释 清楚 ,下 面 先 简单 介绍 其 中 一 部 
分 ,后 面 的 章节 将 根据 内 容 组 织 的 需要 逐步 展开 和 演示 更 多 函数 及 更 加 巧妙 的 用 法 。 遇 
到 不 熟悉 的 函数 可 以 通过 内 置 函 数 help() 查 看 使 用 帮助 。 另 外 ,在 编写 程序 时 应 优先 考 
虑 使 用 内 置 函 数 , 因 为 内 置 机 数 不 仅 成 熟 , 稳 定 ,而且 速度 相对 较 快 。 


241 类 型 转换 与 类 型 判断 


(1) 内 阜 函 数 bin() oct()、hex() 用 来 将 整数 转换 为 二 进 制 . 八 进 制 和 十 六 进 制 形 
式 ,这 3 个 函数 都 要 求 参数 必须 为 整数 。 


# 把 数字 转换 为 二 进 制 串 


>>> bin(555) 


.各 
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"gb1000101011" 
>>> oct (555) # 转 换 为 八进制 串 
"0ol1053， 

>>>hex(555) # 转 换 为 十 六 进 制 串 
,Ooxezb 


内 置 函 数 intO 〇 用 来 将 其 他 形式 的 数字 转换 为 整数 ,参数 可 以 为 整数 ,实数 ,分 数 或 合 


法 的 数字 字符 串 , 当 参数 为 数字 字符 串 时 ,还 允许 指定 第 二 个 参数 base 用 来 说 明 数 字 字 
符 串 的 进 制 。 其 中 ,base 的 取 值 应 为 0 或 2 一 36 的 整数 ,其 中 0 表示 按 数字 字符 串 隐 含 的 
进 制 进行 转换 。 


>>> int (- 3.2) # 把 实数 转换 为 整数 
-3 

>>> fran fractions import Fraction,Decimal 

>>>x= Fraction(7,3) 

>>>x 

Fraction(7,3) 

>>> int (x) # 把 分 数 转换 为 整数 


2 


>>> = Decimal (10/3) 
>>>x 
Decimal ('3.333333333333333481363069950020872056484222412109375") 


>>> int (x) # 把 高 精度 实数 转换 为 整数 

3 

>>> int ('0x22b', 16) # 把 十 六 进 制 数 转换 为 十 进 制 数 

555 

>>> int ('22b',16) # 与 上 一 行 代码 等 价 

555 

>>> int (bin(54321),2) # 二 进 制 与 十 进 制 之 间 的 转换 

54321 

>>> int ('0b111') # 非 十 进 制 字符 串 间 ,必须 指定 第 二 个 参数 
ValueError: invalid literal for int() with base 10: 'Qblll 

>>> int ("Ob111',0) # 第 二 个 参数 0 表示 使 用 字符 串 隐 含 的 进 制 
>>> int ('0b111',6) # 第 二 个 参数 应 与 隐 含 的 进 制 一 致 


ValueError: invalid literal for int() with base 6: 'Obll1' 
>>> int ('0b111',2) 
过 
>>> int ('111',6) # 字 符 串 没有 隐 含 进 制 
# 第 二 个 参数 可 以 为 2~36 之 间 的 数字 
43 


内 置 函 数 float() 用 来 将 其 他 类 型 数据 转换 为 实数 ,complex() 可 以 用 来 生成 复数 。 
>>> float (3) # 把 整数 转换 为 实数 
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3.0 
>>> float ('3.5') # 把 数字 字符 串 转换 为 实数 
3.5 

>>> float (inf') # 无 穷 大 ,其 中 inf 不 区 分 大 小 写 
inf 

>>> camplex(3) # 指 定 实 部 

(3+ 0) 

>>> omplex (3,5) # 指 定 实 部 和 虚 部 

(3+5) 

>>> ccmplex ("inf') # 无 穷 大 

(inf+ 0j) 

>>> float (‘nan') # 非 数字 ,not a mnber 的 缩写 
nan 

>>> carplex ('nan') 

(nant 0j) 

>>> nan= float ('nan') 

>>> nan== float (‘nan') # 无 法 比较 大 小 

False 

>>>nan >=float ('nan') 

False 

>>> nan< = float (‘nan') 

False 


(2) ord() 和 chr() 是 一 对 功能 相反 的 函数 ,ord() 用 来 返回 单个 字符 的 Unicode 码 ， 
而 chr() 则 用 来 返回 Unicode 编码 对 应 的 字符 ,str() 则 直接 将 其 任意 类 型 参数 转换 为 字 
符 串 。 


>>>ord('a') # 查 看 指定 字符 的 Unicode 编码 
97 

>>> chr(65) # 返 回 数字 65 对 应 的 字符 

A 

>>> chr (ord('AN)+1) # Python 不 允许 字符 串 和 数字 之 间 的 加 法 操作 
'B! 

>>>chr(ord(' 国 ')+1) # 支 持 中 文 

' 图 

>>>ord(' 董 ') # 这 个 用 法 仅 适 用 于 Python 3.x 
33891 

>>>ord(' 付 ') 

20184 

>>>ord(' 国 ') 

22269 

>>> '' .join (map (chr, (33891, 20184, 22269) )) 

' 董 付 国 ' 

>>> str (1234) # 直 接 变 成 字符 串 


11234" 
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>>> str([ls2,3]) 
"[L,2,3]" 
>>> str((1,2,3)) 
"(1,2,3)" 
>>> str({1,2,3) 
"{1,2,3}" 


内 置 类 ascii 可 以 把 对 象 转换 为 ASCII 码 表示 形式 ,必要 时 使 用 转 义 字符 来 表示 特定 
的 字符 。 


>>>ascii ('a') 

am 

>>>ascii(' 董 付 国 ') 

NANuB463\Nu4eaB\Nu56farm 

>>>eval( ) # 对 字符 串 进行 求 值 
' 董 付 国 ' 


内 置 类 bytes 用 来 生成 字 节 串 ,或 者 把 指定 对 象 转换 为 特定 编码 的 字 节 串 。 


>>>bytes() # 生 成 空 字 节 串 

by 

>>>bytes (3) # 生 成 长 度 为 3 的 字 节 串 
JP'\x00\x00\x00" 

>>>bytes(' 董 付 国 ', "utf- 8') # 把 字符 串 转换 为 字 节 串 
b'\xe8\x91\xa3\xeA\ xtb\x98\xe5\xP\xbd' 

>>>bytes(' 董 付 国 ','gok') # 可 以 指定 不 同 的 编码 格式 
Db'Nxb6\xadNxb8\xb6\xb9\xfa' 

>>> str(_,'gok') # 使 用 同样 的 编码 格式 进行 解码 
' 董 付 国 ' 

>>> ' 董 付 国 '.encode('gok') # 等 价 于 使 用 bytes() 进 行 转换 
b'\xbé\xad\xb8\xb6\xb9\xfa' 

>>>_.decode ('gok') # 等 价 于 使 用 str() 进 行 转换 
' 董 付 国 ' 

>>> 六 ' 董 付 国 '.enoode() 

>>> list (x) # 把 字 节 串 转换 为 列表 

[232, 145, 163, 228, 187, 152, 229, 155, 189] 

>>>bytes( ) # 把 整数 列表 转换 为 字 节 串 
b'\xe8\x91\xa3\xeA\ xHb\x98\xe5\xP\xbd' 

>>> _.decode () 

' 董 付 国 ' 


(3) list() .tuple() 、dict() ,set() ,frozenset() 用 来 把 其 他 类 型 的 数据 转换 成 为 列表 、 
元 组 .字典 、 可 变 集合 和 不 可 变 集 合 ,或 者 创建 空 列表 、 空 元 组 、 空 字典 和 空 集合 。 


>>> list (range (5)) # 把 range 对 象 转换 为 列表 
[0,1,2,3,4] 
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>>> tuple( ) # 一 个 下 画 线 表示 上 一 次 正确 的 输出 结果 
(0,1,2,3,4) 

>>> dict (zip('1234", 'abode')) # 创 建 字 典 

LO Ws ed EY 

>>> set ("1112234') # 创建 可 变 集合 ,自动 去 除 重复 

RE Wd» 

>>> _.add('5') 

>>>_ 

te 

>>> frozenset ('1112234') # 创 建 不 可 变 集合 ,自动 去 除 重复 
frozenset ({'2','1','3',"'4"}) 

>>>_.ada('50) # 不 可 变 集合 frozenset 不 支持 元 素 添 加 与 删除 
Attributegrror: 'frozenset' cbject has no attribute "add' 


(4) 内 置 函 数 type() 和 isinstance() 可 以 用 来 判断 数据 类 型 ,常用 来 对 函数 参数 进行 
检查 ,可 以 避免 错误 的 参数 类 型 导致 函数 崩溃 或 返回 意料 之 外 的 结果 。 


>>> type (3) # 查 看 3 的 类 型 

<class 'int'> 

>>> type([3]) # 查 看 [3] 的 类 型 

<class 'list'> 

>>> type({3}) in (list,bupleydict) # 判 断 13] 是 否 为 liist、tbple 或 dict 类 型 的 实例 
False 


>>> type({3)) in (list,tuple,dict, set) 
# 判 断 {3} 是 否 为 iist、tuple、dict 或 set 的 实例 

True 

>>> isinstance (3,int) # 判 断 3 是 否 为 int 类 型 的 实例 

True 

>>> isinstance (3j, int) 

False 

>>> isinstance (3j, (int, float, coplex)) 
# 判 断 3 是 否 为 int,float 或 cmplex 类 型 的 实例 


242 最 值 与 求 和 


max() .min() sum() 这 3 个 内 置 函 数 分 别 用 于 计算 列表 、 元 组 或 其 他 包含 有 限 个 元 
素 的 可 迁 代 对 象 中 所 有 元 素 最 大 值 . 最 小 值 以 及 所 有 元 素 之 和 。sum() 默 认 ( 可 以 通过 
start 参数 来 改变 ) 支 持 包 含 数值 型 元 素 的 序列 或 可 迭代 对 象 ,max() 和 min() 则 要 求 序列 
或 可 和 迭代 对 象 中 的 元 素 之 间 可 比较 大 小 。 

>>> fram randcm import randint 

>>> a [randint (1,100) for i in range(l0)] 。 ## 包 含 10 个 [1,100] 之 间 随机 数 的 列表 

>>> print tmax (a) ,min (a) ,sum(a)) # 最 大 值 .最 小 值 、 所 有 元 素 之 和 
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>>> sm(a) /len(a) # 平 均值 


函数 max() 和 min() 还 支持 default 参数 和 key 参数 ,其 中 default 参数 用 来 指定 可 
选 代 对 象 为 空 时 默认 返回 的 最 大 值 或 最 小 值 ,而 key 参数 用 来 指定 比较 大 小 的 依据 或 规 
则 ,可 以 是 函数 或 lambda 表达 式 。 函 数 sum() 还 支持 start 参数 ,用 来 控制 求 和 的 初 
始 值 。 


>>>max(["25 19]) # 不 指定 排序 规则 
>>>max(["2. "111'"],key len) # 返 回 最 长 的 字符 串 
"I 
>>> print tmax([],default= None)) # 对 空 列 表 求 最 大 值 , 返 回 空 值 Nene 
None 
>>> fram randcm import randint 
>>> lst= [[randint (1,50) for i in range(5)] for j in range(30)] 
# 列 表 推 导 式 ,生成 包含 20 个子 列表 的 列表 
# 每 个 子 列表 中 包含 5 个 介 于 [1,50] 区 间 的 整数 


>>> mex (1st, key= sum) # 返 回 元 素 之 和 最 大 的 子 列表 , 略 去 结果 
>>> max (13t, key= sum) # 与 上 面 的 代码 等 价 ,这 是 max() 的 另 一 个 用 法 
>>>max (1st,key= lanibda x: x[1]) # 所 有 子 列表 中 第 2 个 元 素 最 大 的 子 列表 
>>> sum(range (1,11)) # sum() 函 数 的 start 参 数 默认 为 0 
55 
>>> sum(range (1,11),5) # 指 定 start 参数 为 5 
# 等 价 于 5+ sum(range(1,11)) 
60 
>>> sum([[123],[3],[4],D) # 这 个 操作 占用 空间 较 大 , 慎 用 


[1,2,3,4] 
>>> sum(2xxi for i in range(200)) # 等 比 数列 前 n 项 的 和 ,1+2+ 4+ 8+"…+2^199 
1606938044258990275541962092341162602522202993782792835301375 


>>> int ('1'* 200,2) # 等 价 于 上 一 行 代码 ,但 速度 快 很 多 
1606938044258990275541962092341162602522202993782792835301375 
>>> int (1 * 200,7) # 比 值 q 为 2~36 之 间 的 整数 时 ,都 可 以 这 样 做 


1743639715219059529169816601969468943303198091695038943325023347339187627904043 
7086290637691515606750488442080420910523623438633906139318646917923778899694224 39576020000 


>>> sum(range (101)) #101 个 人 开会 ,互相 握手 次 数 ,不 重复 握手 
5050 
>>> 101*100 // 2 # 每 个 人 都 与 其 他 所 有 人 握手 ,但 不 重复 握手 
5050 

243 基本 输入 输出 


input() 和 print() 是 Python 的 基本 输入 输出 函数 ,前 者 用 来 接收 用 户 的 键盘 输入 ， 
后 者 用 来 把 数据 以 指定 的 格式 输出 到 标准 控制 台 或 指定 的 文件 对 象 。 不 论 用 户 输入 什么 
内 容 ,input() 一 律 作为 字符 串 对 待 , 必 要 时 可 以 使 用 内 置 函数 int() \float() 或 eval() 对 用 
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户 输入 的 内 容 进 行 类 型 转换 。 


>>> 二 input ('Please input: ') 

Please input: 345 

3 

,345 

>>> type (x) # 把 用 户 的 输入 作为 字符 串 对 待 
<class 'str'> 

>>> int (x) # 转 换 为 整数 

345 

>>> eval (x) # 对 字符 串 求 值 , 或 类 型 转换 
345 

>>> = input ('Please input: ') 

Please input: [1,2,3] 

>>>x 

"[1,2,3]" 

>>> type (x) 

<class 'str'> 

>>> eval (x) 

[1,2,3] 

>>> ;= input ('Please input:') # 不 论 用 户 输入 什么 ,都 作为 一 个 字符 串 来 对 待 
Please imnput:'"hello world' 

>>>x # 如 果 本 来 就 想 输 入 字符 串 ,就 不 用 再 输入 引号 了 
"hello world'" 

>>> eval (x) 

"hello world' 


内 置 函 数 print() 用 于 输出 信息 到 标准 控制 台 或 指定 文件 ,语法 格式 为 
Print (valuel,value2,… ,sep= ' ',end= '\n', file= sys.stdout,flush= False) 


其 中 ,sep 参数 之 前 为 需要 输出 的 内 容 ( 可 以 有 多 个 ) ;sep 参数 用 于 指定 数据 之 间 的 分 隔 
符 ,默认 为 空格 ;file 参数 用 于 指定 输出 位 置 ,默认 为 标准 控制 台 , 也 可 以 重 定向 输出 到 文 
件 。 例 如 : 


>>>print (1,3,5,7,sep= "\t') # 修 改 默认 分 隔 符 

Ei 广 基 了 

>>> for i in range(10): # 修 改 end 参 数 ,每 个 输出 之 后 不 换行 
Print (i,end= ' ') 

0123456789 

>>> with apen('test.bxt 'at ') as fp: 
print (Hello world! “filer 印 # 重 定向 ,将 内 容 输 出 到 文件 中 


244 ”排序 与 逆序 


sorted() 对 列表 、 元 组 字典、 集合 或 其 他 可 迁 代 对 象 进 行 排序 并 返回 新 列表 ， 
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reversed() 对 可 迁 代 对 象 (生成 器 对 象 和 具有 惰性 求 值 特 性 的 zip、map、filter、enumerate 
等 类 似 对 象 除外 ) 进 行 翻转 (首尾 交换 ) 并 返回 可 迭代 的 reversed 对 象 。 


>>>= list (range (11)) 

>>> import randem 

>>> randam. shuffle (x) # 打 乱 顺 序 

>>>x 

[2,4,0,6,10,7,8,3,9,1,5] 

>>> sorted (x) # 以 默认 规则 排序 
[0,1,2,3,4,5,6,7,8,9,10] 

>>> sorted (x, key= lanbda item:len (str (item)), reverse= True) 


# 按 转换 成 字符 串 以 后 的 长 度 降序 排列 
[10,2, 4,0,6,7,8,3,9,1,5] 
>>> sorted (x,key= str) # 按 转换 成 字符 串 以 后 的 大 小 升序 排列 
[0,1,10,2,3,4,5,6,7,8,9] 
>>>x # 不 影响 原来 列表 的 元 素 顺序 


2,4,0,6,10,7,8,3,9,1,5] 
>>> 关 ['aaaa', bec', 'd', 'b', ‘ba'] 
>>> sorted (x, key= lanbda item: (len (item ,item ) 
# 先 按 长 度 排序 ,长 度 一 样 的 正常 排序 
['b','d', "bav ‘bc', ‘aaaa'] 


>>> reversed (x) # 道 序 ,返回 reversed 对 象 
< list reverseiterator cbject at 0x0000000003089E48> 
>>> list (reversed(x)) # reversed 对 象 是 可 和 迭代 的 


[5,1,9,3,8,7,10,6,0,4,2] 


245 枚 举 


enumerate() 困 数 用 来 枚 举 可 和 迭代 对 象 中 的 元 素 , 返 回 可 迭代 的 enumerate 对 象 ,其 
中 每 个 元 素 都 是 包含 索引 和 值 的 元 组 。 


>>> list (enumerate ('abod')) # 枚 举 字符 串 中 的 元 素 
[(0,'a'), tb) (2,'c'), (3,'d')] 
>>> list (enumerate (['Python', 'Greate'])) # 枚 举 列表 中 的 元 素 


[(0, "Python'), (1, 'Greate')] 

>>> list (enumerate({'a':97, 'b':98, 'c':99}.items())) ## 枚 举 字 典 中 的 元 素 

[(0, ('c',99)), (1, ("a',97)), (2, ('b"', 98))] 

>>> for index,value in enumerate (range (10,15)): # 枚 举 range 对 象 中 的 元 素 
Print ((index,value) ,end= ' ') 

(0,10) (1,11) (2,12) (3,13) (4,14) 


内 管 函数 enumerate() 还 支持 一 个 start 参数 ,用 来 指定 枚 举 时 的 索引 起 始 值 。 


>>> for item in enumerate (range (5) ,6) : # 索 引 从 6 开始 
print (itemend ', ') 
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(6,0), (7,1), (8,2), (9,3), (10,4), 


246 ~ mep() ,reduce() filter() 


map() ,reduce() ,filter() 是 Python 中 很 常用 的 几 个 函数 ,也 是 Python 支持 函数 式 
编程 的 重要 体现 。 要 注意 的 是 ,在 Python 3. x 中 ,reduce() 不 是 内 置 函 数 , 而 是 放 到 了 标 
准 库 functools 中 ,需要 先导 和 人 再 使 用 。 

函数 式 编程 把 问题 分 解 为 一 系列 的 函数 操作 ,输入 依次 流入 和 流出 一 系列 函数 ,最 终 
完成 预定 任务 和 目标 。 在 理想 状态 下 ,每 个 函数 只 是 接收 输入 并 在 简单 处 理 后 产生 输出 ， 
这 些 输出 完全 取决 于 输入 和 函数 指定 的 操作 并 且 仅 通过 函数 返回 值 来 体现 ,而 不 会 引入 
或 造成 任何 副作用 (例如 ,输入 和 一 些 内 部 状态 共同 决定 输出 、 修 改 输入 的 数据 .把 一 些 数 
据 和 状态 输出 到 屏幕 或 文件 等 ) 。 函 数 式 编程 具有 很 多 优点 ,如 容易 构建 一 个 数学 模型 来 
证 明 程 序 的 正确 性 ,程序 更 加 模块 化 ,容易 调试 和 测试 ,代码 复 用 率 高 ,等 等 。 

内 置 函数 map() 把 一 个 函数 func 依次 映射 到 序列 或 迭代 器 对 象 的 每 个 元 素 上 ,并 返 
回 一 个 可 迭代 的 map 对 象 作为 结果 ,map 对 象 中 每 个 元 素 是 原 序列 中 元 素 经 过 函数 func 
处 理 后 的 结果 ,map() 函 数 不 对 原 序 列 或 迭代 器 对 象 做 任何 修改 。 





>>> list map (str, range (5))) # 把 列表 中 的 元 素 转换 为 字符 串 
wd Rr 
>>> def add5 (v) : # 单 参数 函数 
retum v+5 
>>> list (map (add5, range (10))) # 把 单 参数 函数 映射 到 一 个 序列 的 所 有 元 素 
5,6,7,8,9,10,11,12,13, 14] 
>>> def add (x,y) : # 可 以 接收 2 个 参数 的 函数 
retum xty 
>>> list tnap add, range (5) , range (5, 10))) # 把 双 参 数 函 数 映射 到 两 个 序列 上 
5,7,9,11,13] 
>>> list (map (lambda x,y: x+ y,range (5), range(5,10))) 
5,7,9,11,13] 
>>> def myMap (1st,value) : # 自 定义 函数 
retum map (laribda item: itemt value, 1st) 
>>> list tryMep (range (5) ,5)) # 每 个 数字 加 5 
[5,6,7,8,9] 
>>> list (myMep (range (5) ,8)) # 每 个 数字 加 8 
[8,9,10,11,12] 
>>> def myMap (iterableyapyvalue) : ## 自 定义 函数 
证 ap not in t+- #*/": # 实 现 序列 与 数字 的 四 则 运算 


retum "Error aperator'" 
func= lanbda i:eval (repr (i)+ opt repr (value)) 
retum map (func, iterable) 

>>> List (myMap (range (5), "+ ',5)) 

[5,6,7,8,9] 
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>>> List myMep (range (5),'— ',5)) 
[5,-4-3,-2,-1] 

>>> list myMep (range (5),' * ',5)) 
[0,5,10,15, 20] 

>>> list (myMap (range (5), '/',5)) 
[0.0,0.2,0.4,0.6,0.8] 


>>> import randem 

>>> = randam. randint (1, 1e30) # 生 成 指定 范围 内 的 随机 整数 
>>>x 

839746558215897242220046223150 

>>> List (map (int, str (x))) # 提 取 大 整数 每 位 上 的 数字 


[8,3,9,7,4,6,5,5,8,2,1,5,8,9,7,2,4,2,2,2,0,0,4,6,2,2,3,1,5,0] 


标准 库 functools 中 的 函数 reduce() 可 以 将 一 个 接收 两 个 参数 的 函数 以 迭代 累积 的 
方式 从 左 到 右 依 次 作用 到 一 个 序列 或 迭代 器 对 象 的 所 有 元 素 上 .并且 人 允许 指定 一 个 初始 
值 。 例 如 ,reduce(lambda x, y: x 十 y, [1, 2, 3, 4, 5]) 计 算 过 程 为 (CC((1 十 2) 十 3) 十 4) 十 5)， 
第 一 次 计算 时 x 为 1 而 y 为 2, 再 次 计算 时 x 的 值 为 (1 十 2) 而 y 的 值 为 3, 再 次 计算 时 x 
的 值 为 ((1 十 2) 十 3) 而 y 的 值 为 4, 以 此 类 推 , 最 终 完成 计算 并 返回 ((((1 十 2) 十 3) 十 4) 十 


5) 的 值 。 
>>> fram functools import reduce 
>>> seqF= list (range (1,10)) # 也 可 以 不 用 转换 为 列表 
>>> reduce add seq) # ada 是 上 一 段 代码 中 定义 的 函数 
45 
>>> reduce (lanbda x,y: x+ y,seq) # 使 用 lambda 表 达 式 实现 相同 功能 
45 
上 面 实现 数字 累加 的 代码 运行 过 程 如 图 2-1 所 示 。 
>>> import cperator # 标 准 库 cperator 提 供 了 大 量 运 算 
>>> operator.add (3,5) # 可 以 像 普通 函数 一 样 直接 调用 
8 
>>> reduce (operator.ada, seq) # 使 用 aaa 运 算 
45 
>>> reduce (operator.add, seqy5) # 指 定 累加 的 初始 值 为 5 
50 
>>> reduce (cperator .ml, seq) # 乘 法 运算 
362880 
>>> reduce (operator .ml, range (1, 6)) #5 的 阶乘 
120 
>>> reduce (operator.add, map (str, seq) ) # 转 换 成 字符 串 再 累加 
"123456789" 
>>> '' .join tmap (str, seq) ) # 使 用 join() 方 法 实现 字符 串 连接 
"123456789" 


>>> reduce (operator.ada, [[1,2], [3]], []) # 这 个 操作 占用 空间 较 大 , 慎 用 
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图 2-1 reduce() 函 数 执行 过 程 示意 图 


内 置 函 数 filter() 将 一 个 单 参数 函数 作用 到 一 个 序列 上 ,返回 该 序列 中 使 得 该 函数 返 
回 值 为 True 的 那些 元 素 组 成 的 filter 对 象 ,如 果 指定 函数 为 None, 则 返回 序列 中 等 价 于 


True 的 元 素 。 


>>> 3eqF= ["foo' "x41",'?! 关头 其 
>>> def func(x) : 

retum x.isalnum() 
>>> filter (func, seq) 
< filter cbject at 0x000000000305D898> 
>>> list (filter (func, seq)) 
["foo' 'x41'] 
>>> seq 
['fo0', xd, "3! ,rs 
>>> [x for x in seq if x.isalnum()] 
['fo0', ‘x41'] 
>>> list (filter (lanbda x: x.isalnum() ,seq)) 
[foov 'x41'] 
>>> list (filter (None, [1,2,3,0,0,4,0,5])) 
[1,2,3,4,5] 
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# 测 试 是 否 为 字母 或 数字 
# 返 回 filter 对 象 


# 把 filter 对 象 转换 为 列表 


# 不 对 原 列表 做 任何 修改 


# 使 用 列表 推导 式 实现 相同 功能 


# 使 用 lanbda 表达 式 实现 相同 功能 


# 指 定 函 数 为 Nene 


range() 是 Python 开发 中 非常 常用 的 一 个 内 置 函 数 ,语法 格式 为 range ([ start,] 
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end [，step] ) ,有 range(stop) ,range(Cstart，stop) 和 range(start，stop，step)3 种 用 法 。 
该 函数 返回 具有 情 性 求 值 特点 的 range 对 象 ,其 中 包含 左 闭 右 开 区 间 [start,end) 内 以 step 
为 步 长 的 整数 。 参 数 start 默认 为 0,step 默认 为 1。 


>>> range (5) # start 默 认为 0,step 默 认为 1 
range (0,5) 

>>> list( ) 

[0,1,2,3,4] 

>>> list (range (1,10,2)) # 指 定 起 始 值 和 步 长 

[1,3,5,7,9] 

>>> list (range (9,0,- 2)) # 步 长 为 负数 时 ,start 应 比 end 大 
[9,7,5,3,1] 


在 循环 结构 中 经 常 使 用 range() 函数 来 控制 循环 次 数 ,例如 : 


>>> for i in range(4): # 循 环 4 次 
Print(3,enG= "' ') 
3333 
当然 ,也 可 以 使 用 range() 函 数 来 控制 数值 范围 。 例 如 ,下 面 的 程序 片段 可 以 用 来 输 
出 200 以 内 能 被 17 整除 的 最 大 正 整 数 。 


for i in range (200,0,- 1): 


if i%1F=0: 
print (i) 
break 
248 zp() 


zip() 函数 用 来 把 多 个 可 迭代 对 象 中 的 元 素 压缩 到 一 起 ,返回 一 个 可 迭代 的 zip 对 象 ， 
其 中 每 个 元 素 都 是 包含 原来 的 多 个 可 迁 代 对 象 对 应 位 置 上 元 素 的 元 组 ,最 终结 果 中 包含 
的 元 素 个 数 取决 于 所 有 参数 序列 或 可 迭代 对 象 中 最 短 的 那个 。 可 以 这 样 理解 这 个 函数 ， 
把 多 个 序列 或 可 和 迭代 对 象 中 的 所 有 元 素 左 对 齐 ,然后 像 拉 拉 链 一 样 往 右 拉 , 把 所 经 过 的 每 
个 序列 中 相同 位 置 上 的 元 素 都 放 到 一 个 元 组 中 ,只 要 有 一 个 序列 中 的 所 有 元 素 都 处 理 完 
了 就 不 再 拉 拉 链 了 ,返回 包含 若干 元 组 的 zip 对 象 。 


>>> list (zip('abod', [1,2,3])) # 压 缩 字符 串 和 列表 

[('a',l), (b',2), ('c',3)] 

>>> list (zip('abod')) # 对 1 个 序列 也 可 以 压缩 

[('a'), (Yb',), ('c'), ("qd',)] 

>>> list (zip('123', 'abc',',.! ')) # 压 缩 3 个 序列 

Oe ey PY eh iy TG ee i) 

>>> for item in zip('abod', range (3)): #zip 对 象 是 可 和 迭代 的 
print (item) 


(av0) 
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(b',D) 

('c',2) 

>>> 六 zip(abcdv "1234") 

>>> list (x) 

[('a','l’), (Yb','2"), ('c','3"), ('d','4")] 

>>> list (x) # zip 对 象 只 能 遍历 一 次 
0 


249 eall) 


内 置 函数 eval() 用 来 计算 字符 串 的 值 ,在 有 些 场 合 也 可 以 用 来 实现 类 型 转换 的 功能 ， 
这 个 用 法 在 2.4.1 节 和 2.4.3 节 出 现 过 多 次 ,这 里 不 再 重复 。 除 此 之 外 ,eval() 也 可 以 对 


字 节 串 进行 求 值 , 还 可 以 执行 内 置 函 数 compile() 编 译 生成 的 代码 对 象 。 


>>> eval (b'3+ 5') 

8 

>>> eval (carpile('print (3+ 5) ', 'tenp.txt', 'exec')) 

8 

>>> eval('9') # 把 数字 字符 串 转换 为 数字 

9 

>>> eval ('09') # 抛 出 异常 ,不 允许 以 0 开头 的 数字 
SyntaxError: invalid token 

>>> int ('09") # 这 样 转换 是 可 以 的 

9 


另外 ,由 于 eval() 并 不 对 参数 字符 串 进行 安全 性 检查 ,如 果 精 心 构造 一 些 语句 可 能 会 


引发 安全 漏洞 ,应 尽量 使 用 标准 库 ast 提供 的 安全 求 值 函 数 literal _eval() 。 


>>> eval ("_ _import _('os').startfile(r'C:\Windows\\notepad.exe')") 
# 打 开 记 事 本 程序 
>>> jimport ast 
>>> ast.literal eval(" _import _('os').startfile(r'C:\Windws\\notepad.ee')") 
# 无 法 执行 ,引发 异常 


VBlusPrror: malformed node or string:<_ast.Call dbject at 8> 





2.5 精彩 案例 赏析 


示例 2-1 用 户 输入 一 个 三 位 自然 数 ,计算 并 输出 其 百 位 、 十 位 和 个 位 上 的 数字 。 
解法 一 : 


= input(' 请 输入 一 个 三 位 数 :') 
2 int (x) 

ex // 100 

bx//10% 10 
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cx%10 

Print(a, by c) 

解法 二 : 

z= input(" 请 输入 一 个 三 位 数 :) 
x= int (x) 

ar b= divmod (x, 100) 

b, c= divwd(b, 10) 

print (a, by c) 


解法 三 : 

= input(' 请 输入 一 个 三 位 数 :') 
ar by c=maplint, x) 

print (a, by ©) 


示例 2-2 已 知 三 角形 的 两 边 长 及 其 夹 角 , 求 第 三 边 长 。 
import math 


=input (输入 两 边 长 及 夹 角度 ):') 

ar b, theta=map(float, x.split()) 

c=math.sqrt (at*2+bt*2- 2# ax bx math.cos (thetax math.pi/180)) 
print('c="', c) 


示例 2-3 任意 输入 3 个 英文 单词 , 按 字 典 顺序 输出 。 
于 input('xy,= ) 


x, Y 2 =sorted(s.split(',')) 
Print (x, y, 2) 


本 章 小 结 


(1) Python 中 一 切 都 是 对 象 。 

(2) 在 Python 中 ,不 需要 事先 声明 变量 名 及 其 类 型 ,直接 赋值 就 可 以 创建 任意 类 型 
的 变量 。 

(3) 在 Python 中 ,不 仅 变量 的 值 是 可 以 变化 的 ,类 型 也 是 可 以 随时 发 生变 化 的 。 

(4) Python 采用 基于 值 的 内 存 管理 模式 。 

(5) Python 属于 强 类 型 编程 语言 。 

(6) Python 变量 名 必须 以 字母 或 下 面 线 开头 且 不 能 包含 空格 或 标点 符号 ,不 能 使 用 
关键 字 作 为 变量 名 ,不 建议 使 用 内 置 对 象 . 标 准 库 对 象 或 扩展 库 对 象 作为 变量 名 。 

(7) Python 字符 串 与 字 节 串 之 间 可 以 互相 转换 。 

(8) 圆 括号 是 明确 和 改变 表达 式 运算 顺序 的 利器 。 








TI- 
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忆 
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习 题 
表达 式 int(11111', 2) 的 值 为 
表达 式 chr(ord(D") 十 2) 的 值 为 
简单 解释 Python 基于 值 的 内 存 管 理 模式 。 
简单 解释 运算 符 / 和 // 的 区 别 。 
运算 符 % (可 以 /不 可 以 ) 对 浮 点 数 进行 求 余 数 操作 。 
一 个 数字 5 (是 /不 是 ) 合 法 的 Python 表达 式 。 


判断 对 错 : 在 Python 3. x 中 ,内 置 函 数 input() 把 用 户 的 键盘 输入 一 律 作 为 字 
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3” 玄 之 又 玄 , 众 妙 之 门 : 详解 
” Python 序列 结构 





Python 中 常用 的 序列 结构 有 列表 、 元 组 .字典 .字符 串 、 集 合 等 (虽然 有 人 并 不 主张 把 
字典 和 集合 看 作 序列 ,但 这 真 的 不 重要 )。 从 是 否 有 序 这 个 角度 看 ,Python 序列 可 以 分 为 
有 序 序列 和 无 序 序列 ;从 是 否 可 变 来 看 ,Python 序列 则 可 以 分 为 可 变 序列 和 不 可 变 序列 
两 大 类 ,如 图 3-1 所 示 。 另 外 ,生成 器 对 象 和 range、map、enumerate,filter、zip 等 对 象 的 
某 些 用 法 也 类 似 于 序列 ,尽管 这 些 对 象 更 大 的 特点 是 惰性 求 值 。 列 表 、 元 组 .字符 串 等 有 
序 序列 以 及 range 对 象 均 支持 双向 索引 ,第 一 个 元 素 下 标 为 0, 第 二 个 元 素 下 标 为 1, 以 此 
类 推 ; 如 果 使 用 负数 作为 索引 , 则 最 后 一 个 元 素 下 标 为 一 1, 倒 数 第 二 个 元 素 下 标 为 一 2 ,以 
此 类 推 。 可 以 使 用 负 整 数 作为 索引 是 Python 有 序 序列 的 一 大 特色 ,熟练 掌握 和 运用 可 以 
大 幅度 提高 开发 效率 。 














有 序 序列 





可 变 序列 





























不 可 变 序列 














无 序 序列 上 














图 3-1 Python 序列 分 类 示意 图 


3.1 列表 : 打 了 激素 的 数组 


列表 (lisb) 是 最 重要 的 Python 内 置 对 象 之 一 ,是 包含 若干 元 素 的 有 序 连 续 内 存 空间 。 
当 列表 增 加 或 删除 元 素 时 ,列表 对 象 自动 进行 内 存 的 扩展 或 收缩 ,从 而 保证 相 邻 元 素 之 间 没 
有 缝隙 。Python 列表 的 这 个 内 存 自动 管理 功能 可 以 大 幅度 减少 程序 员 的 负担 ,但 插入 和 删 
除非 尾部 元 素 时 涉及 列表 中 大 量 元 素 的 移动 ,会 严重 影响 效率 。 另 外 ,在 非 尾部 位 置 插 入 和 
删除 元 素 时 会 改变 该 位 置 后面 的 元 素 在 列表 中 的 索引 ,这 对 于 某 些 操作 可 能 会 导致 意外 的 
错误 结果 。 所 以 ,除非 确实 有 必要 ,和 否则 应 尽量 从 列表 尾部 进行 元 素 的 追加 与 删除 操作 。 
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在 形式 上 ,列表 的 所 有 元 素 放 在 一 对 方 括号 [] 中 , 相 邻 元 素 之 间 使 用 逗号 分 隔 。 在 
Python 中 ,同一 个 列表 中 元 素 的 数据 类 型 可 以 各 不 相同 ,可 以 同时 包含 整数 .实数 、 字 符 
串 等 基本 类 型 的 元 素 , 也 可 以 包含 列表 元 组 ,字典 .集合 、 函 数 以 及 其 他 任意 对 象 。 如 果 
只 有 一 对 方 括号 而 没有 任何 元 素 则 表示 空 列表 。 下 面 几 个 都 是 合法 的 列表 对 象 : 

[10, 20, 30, 40] 

["crunchy frog' 'ram bladder"', 'lark vomit'] 

["'spam',2.0,5, [10,20]] 

[['filel',200,7], ['file?2',260,9]] 

[{3}, {5:6}, (1,2,3)] 

Python 采用 基于 值 的 自动 内 存 管理 模式 ,变量 并 不 直接 存储 值 ,而 是 存储 值 的 引用 
或 内 存 地 址 ,这 也 是 python 中 变量 可 以 随时 改变 类 型 的 重要 原因 。 同 理 , Python 列表 中 
的 元 素 也 是 值 的 引用 ,所 以 列表 中 各 元 素 可 以 是 不 同类 型 的 数据 。 

需要 注意 的 是 ,列表 的 功能 虽然 非常 强大 ,但 是 负担 也 比较 重 , 开 销 较 大 ,在 实际 开发 
中 ,最 好 根据 实际 的 问题 选择 一 种 合适 的 数据 类 型 ,要 尽量 避免 过 多 使 用 列表 。 

311 列表 创建 与 删除 

使 用 “二 ”直接 将 一 个 列表 赋值 给 变量 即 可 创建 列表 对 象 。 

>>>a_list= ['a', 'b', mpilgrim', 'z', 'exanple'] 

>>>a list= [] # 创 建 空 列表 

也 可 以 使 用 list() 函 数 把 元 组 range 对 象 , 字 符 串 、 字 典 、 集 合 或 其 他 可 迭代 对 象 转 
换 为 列表 。 需 要 注意 的 是 ,把 字典 转换 为 列表 时 默认 是 将 字典 的 “ 键 ”" 转 换 为 列表 ,而 不 是 
把 字典 的 元 素 转 换 为 列表 ,如 果 想 把 字典 的 元 素 转换 为 列表 ,需要 使 用 字典 对 象 的 
items() 方 法 明确 说 明 ,当然 也 可 以 使 用 values() 来 明确 说 明 要 把 字典 的 “ 值 ” 转 换 为 
列表 。 


>>> list ((3,5,7,9,11)) # 将 元 组 转换 为 列表 
[3,5,7,9,11] 

>>> list (range (1,10,2)) # 将 range 对 象 转换 为 列表 
[1,3,5,7,9] 

>>> list ('hello world') # 将 字符 串 转换 为 列表 
['h', er 0, ,wo rl, 'd'] 

>>> List ({3,7,5}) # 将 集合 转换 为 列表 

[3,5,7] 

>>> list ({'a':3, 'b':9, 'c':78}) # 将 字典 的 “ 键 " 转 换 为 列表 
7 

>>> List ({'a':3, 'b':9, 'c':78}.items()) # 将 字典 的 “ 键 : 值 ? 对 转换 为 列表 
[('b',9), ('c',78), (‘a',3)] 

>>>z= list() # 创 建 空 列表 


当 一 个 列表 不 再 使 用 时 ,可 以 使 用 del 命令 将 其 删除 ,这 一 点 适用 于 所 有 类 型 的 


SS 
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Python 对 象 。 
>>> 六 [1,2,3] 
>>>delx ## 删 除 列表 对 象 
>>>x # 对 象 删除 后 无 法 再 访问 , 抛 出 异常 


NameFrror: name 'x' is not defined 


312 列表 元 素 访 问 


创建 列表 之 后 ,可 以 使 用 整数 作为 下 标 来 访问 其 中 的 元 素 , 其 中 下 标 为 0 的 元 素 表示 
第 1 个 元 素 , 下 标 为 1 的 元 素 表 示 第 2 个 元 素 , 下 标 为 2 的 元 素 表 示 第 3 个 元 素 , 以 此 类 
推 ; 列 表 还 支持 使 用 负 整数 作为 下 标 ,其 中 下 标 为 一 1 的 元 素 表 示 最 后 一 个 元 素 , 下 标 为 
一 2 的 元 素 表示 倒数 第 2 个 元 素 , 下 标 为 一 3 的 元 素 表 示 倒 数 第 3 个 元 素 , 以 此 类 推 ,如 
图 3-2 所 示 ( 以 列表 [P',，Yy'，*t'， Ph','0', mn 为 例 ) 。 

>>> 二 list ('Python') # 创 建 列表 对 象 

>>>x 

Cp Eh on 


>>> x[0] # 下 标 为 0 的 元 素 ,第 一 个 元 素 
二 
>>>x[-1] # 下 标 为 -1 的 元 素 ,最 后 一 个 元 素 
i 

和 -本 -一 -一 本 一- 一- 一- 一 一 一 一 一 

vivyieiwiel "|) 

和 -~ 本 ~- 本 -一 二 -本 一 -一 二 一 一- 

0 1 2 3 4 5 6 

6 当 4 3 攻 14 


图 3-2 ”双向 索引 示意 图 


313 列表 常用 方法 


列表 、 元 组 字典、 集合 .字符 串 等 Python 序列 有 很 多 操作 是 通用 的 ,而 不 同类 型 的 
序列 又 有 一 些 特有 的 方法 或 者 支持 某 些 特有 的 运算 符 和 内 置 函数 。 列 表 对 象 常用 的 方法 
如 表 3-1 所 示 。 


表 3-1 列表 对 象 常用 的 方法 

















方 法 说 明 
append(x) 将 x 追加 至 列表 尾部 
extend(L) 将 列表 L 中 的 所 有 元 素 追 加 至 列表 尾部 
在 列表 index 位 置 处 插入 x, 该 位 置 后 面 的 所 有 元 素 后 移 并 且 在 列表 中 
insert(index, x) 的 索引 加 1, 如 果 index 为 正 数 且 大 于 列表 长 度 则 在 列表 尾部 追加 x, 如 
果 index 为 负数 且 小 于 列表 长 度 的 相反 数 则 在 列表 头 部 插入 元 素 x 
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续 表 





方 法 


说 明 





remove(x) 


在 列表 中 删除 第 一 个 值 为 x 的 元 素 , 该 元 素 之 后 所 有 元 素 前 移 并 且 索 
引 减 1, 如 果 列 表 中 不 存在 x 则 抛 出 异常 





pop([index]) 


删除 并 返回 列表 中 下 标 为 index 的 元 素 , 如 果 不 指定 index 则 默认 为 
一 1, 弹 出 最 后 一 个 元 素 ; 如 果 弹 出 中 间 位 置 的 元 素 则 后 面 的 元 素 索 引 减 
1; 如 果 index 不 是 [一 L, L) 区 间 的 整数 则 抛 出 异常 ,L 表示 列表 长 度 





clear() 


清空 列表 ,删除 列表 中 的 所 有 元 素 ,保留 列表 对 象 





index(x) 


返回 列表 中 第 一 个 值 为 x 的 元 素 的 索引 , 若 不 存在 值 为 x 的 元 素 则 抛 
出 异常 





count(x) 


返回 x 在 列表 中 的 出 现 次 数 





reverse() 


对 列表 所 有 元 素 进行 原 地 逆序 ,首尾 交换 





sort(key= None, reverse= 
False) 


对 列表 中 的 元 素 进 行 原 地 排序 , key 用 来 指定 排序 规则 , reverse 为 
False 表示 升序 ,True 表示 降序 





copy() 





返回 列表 的 浅 复制 


1. append( ) ,insert() .extend() 


这 3 个 方法 都 可 以 用 于 向 列表 对 象 中 添加 元 素 , 其 中 append() 用 于 向 列表 尾部 追加 
一 个 元 素 ,insert() 用 于 向 列表 任意 指定 位 置 插入 一 个 元 素 ,extend() 用 于 将 另 一 个 列表 
中 的 所 有 元 素 追 加 至 当前 列表 的 尾部 。 这 3 个 方法 都 属于 原 地 操作 ,不 影响 列表 对 象 在 
内 存 中 的 起 始 地 址 。 对 于 长 列表 而 言 , 使 用 insert() 方 法 在 列表 首部 或 中 间 位 置 插入 元 
素 时 效率 较 低 。 如 果 确 实 需要 在 首部 按 序 插入 多 个 元 素 , 可 以 先 在 尾部 追加 ,然后 使 用 
reverse() 方 法 进行 翻转 ,或 者 考虑 使 用 标准 库 collections 中 的 双 端 队列 deque 对 象 提供 


的 appendleft() 方 法 。 


>>> 交 [1,2,3] 

>>> id(x) 

50159368 

>>> x.append (4) 

>>> x.insert (0,0) 
>>> x.extend([5,6,7]) 
>>>x 
[0,1,2,3,4,5,6,7] 

>>> id(x) 

50159368 


# 查 看 对 象 的 内 存 地 址 
# 在 尾部 追加 元 素 


# 在 指定 位 置 插 人 元 素 
# 在 尾部 追加 多 个 元 素 


# 列 表 在 内 存 中 的 地 址 不 变 


2. pop() remove() clear() 


这 3 个 方法 用 于 删除 列表 中 的 元 素 , 其 中 pop() 用 于 删除 并 返回 指定 位 置 (默认 是 最 
后 一 个 ) 上 的 元 素 , 如 果 指 定 的 位 置 不 是 合法 的 索引 则 抛 出 异常 ,对 空 列 表 调 用 pop( ) 方 
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法 也 会 抛 出 异常 ;remove() 用 于 删除 列表 中 第 一 个 值 与 指定 值 相 等 的 元 素 ,如 果 列 表 中 
不 存在 该 元 素 则 抛 出 异常 ;clear() 用 于 清空 列表 中 的 所 有 元 素 。 这 3 个 方法 也 属于 原 地 
操作 ,不 影响 列表 对 象 的 内 存 地 址 。 另 外 ,还 可 以 使 用 del 命令 删除 列表 中 指定 位 置 的 元 


素 , 这 个 方法 同样 也 属于 原 地 操作 。 
>>> [1,2,3,4,5,6,7] 
>>>x.Pop() ## 弹 出 并 返回 尾部 元 素 
>>> x.pop(0) 考 弹 出 并 返回 指定 位 置 的 元 素 
a 
>>>x.clear() # 删 除 所 有 元 素 
>>>x 


0 
>>>= [1,2,1,1,2] 


>>> x.remove (2) # 删 除 首 个 值 为 2 的 元 素 
>>> del x[3] # 删 除 指定 位 置 上 的 元 素 
>>>x 
[L111] 


必须 强调 的 是 ,由 于 列表 具有 内 存 自动 收缩 和 扩张 功能 ,在 列表 中 间 位 置 插入 或 删除 
元 素 时 ,不仅 效率 较 低 ,而 且 该 位 置 后 面 所 有 元 素 在 列表 中 的 索引 也 会 发 生变 化 ,必须 牢 
牢记 住 这 一 点 。 


3. count() ,index() 


列表 方法 count() 用 于 返回 列表 中 指定 元 素 出 现 的 次 数 ;index() 用 于 返回 指定 元 素 
在 列表 中 首次 出 现 的 位 置 ,如 果 该 元 素 不 在 列表 中 则 抛 出 异常 。 


>>> 闪 [1,2,2,3,3,3,4,4,44] 


>>>x.count (3) # 元 素 3 在 列表 x 中 的 出 现 次 数 

# 不 存在 ,返回 0 

SR # 元 素 2 在 列表 x 中 首次 出 现 的 索引 
# 列 表 x 中 没有 5 抛 出 异常 


ValueRrror: 5 is not in list 


通过 前 面 的 介绍 我 们 已 经 知道 ,列表 对 象 的 很 多 方法 在 特殊 情况 下 会 抛 出 异常 ,而 一 
且 出 现 异 常 ,整个 程序 就 会 崩溃 ,这 是 我 们 不 希望 的 。 为 避免 引发 异常 而 导致 程序 崩溃 ， 
一 般 来 说 有 两 种 方法 : 四 使 用 选择 结构 确保 列表 中 存在 指定 元 素 再 调用 有 关 的 方法 ; 
加 使 用 异常 处 理 结构 。 下 面 的 代码 使 用 异常 处 理 结构 保证 用 户 输入 的 是 三 位 数 ,然后 使 
用 关键 字 in 来 测试 用 户 输入 的 数字 是 否 在 列表 中 ,如 果 存 在 则 输出 其 索引 ,和 否则 提示 不 
存在 。 
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fram randem inport sample 
1st= sample (range (100, 1000) ,100) 


while True: 
=input ("请 输入 一 个 三 位 数 : ') 
try: 
assert len(x)==3, "长 度 必须 为 3' 
= int (x) 
break 
exospt: 
Pass 


if x in lst: 

Print(" 元 素 {0) 在 列表 中 的 索引 为 : {1}'.fommat (x,1st.index (x))) 
else: 
print ("列表 中 不 存在 该 元 素 .") 


4. sort() reverse() 


列表 对 象 的 sort() 方 法 用 于 按照 指定 的 规则 对 所 有 元 素 进行 排序 ,默认 规则 是 所 有 
元 素 从 小 到 大 升序 排序 ;reverse() 方 法 用 于 将 列表 所 有 元 素 逆序 或 翻转 ,也 就 是 第 一 个 
元 素 和 倒数 第 一 个 元 素 交换 位 置 ,第 二 个 元 素 和 倒数 第 二 个 元 素 交 换 位 置 ,以 此 类 推 。 


>>>2= list (range (11)) # 包 含 11 个 整数 的 列表 

>>> jimport randcm 

>>> randcm.shuffle(x) # 把 列表 x 中 的 元 素 随 机 乱 序 
>>>x 


[6,0,1,7,4,3,2,8,5,10,9] 
>>> x.sort (key= lanbda item:]len (str (item)), reverse= True) 
# 按 转换 成 字符 串 以 后 的 长 度 降序 排列 
>>>x 
[10,6,0,1,7,4,3,2,8,5,9] 
>>> x.sort (key= str) # 按 转换 为 字符 串 后 的 大 小 升序 排序 
>>>x 
[0,1,10,2,3,4,5,6,7,8,9] 
>>> x.sort () # 按 默认 规则 排序 
>>>x 
[0,1,2,3,4,5,6,7,8,9,10] 
>>> x.reverse() # 把 所 有 元 素 翻转 或 逆序 
>>>x 
[10,9,8,7,6,5,4,3,2,1,0] 


列表 对 和 象 的 sort() 和 reverse() 分 别 对 列表 进行 原 地 排序 (in-place sorting) 和 逆序 , 没 
有 返回 值 。 所 谓 * 原 地 ”, 意 思 是 用 处 理 后 的 数据 蔡 换 原来 的 数据 ,列表 首 地 址 不 变 , 列 表 
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中 元 素 原来 的 顺序 全 部 丢失 。 

如 果 不 想 丢 失 原 来 的 顺序 ,可 以 使 用 2. 4.4 节 介绍 的 内 置 函 数 sorted() 和 
reversed() 。 其 中 ,内 置 函数 sorted() 返 回 排序 后 的 新 列表 ,参数 key 和 reverse 的 含义 与 
列表 方法 sort() 完 全 相同 ;内 置 函数 reversed() 返 回 一 个 道 序 后 的 reversed 对 象 。 充 分 
利用 列表 对 象 的 sortO) 方 法 和 内 置 函 数 sorted() 的 key 参数 ,可 以 实现 更 加 复杂 的 排序 ， 
以 内 置 函 数 sorted() 为 例 : 


>>> gameresult= [['Bcb', 95.0, 'A'], 
['Alan',86.0,'C'], 
[Mandy"',83.5,'A'], 
["Bab',89.3, 'E']] 
>>> fram operator import itemgetter 
>>> sorted (gameresult,key= itemgetter(2)) 。 # 按 子 列表 第 3 个 元 素 进行 升序 排序 
[["Bab',95.0, A'], ['Mandy', 83.5, 'A'], ['Alan', 86.0, 'C'], ["Rab',89.3, 'E'] 
>>> sorted (gameresult, key= itemgetter (2,0)) 
# 先 按 第 3 个 元 素 升序 并 排列 ,再 按 第 一 个 元 素 升序 排序 
[['Bcb', 95.0, A'], ['Mandy', 83.5, 'A'], ['Alan', 86.0, 'C'], ['Rcb',89.3, 'E'] 
>>> sorted (gameresult, key= itemgetter (2, 0) , reverse= True) 
[['Rob',89.3, 'E'], ['Alan',86.0, 'C'], ['Mandy', 83.5, 'A'], ['Bcb', 95.0, 'A'] 
>>> listl= [rwihatw "I'm", "sorting", "by"] # 以 一 个 列表 内 容 为 依据 
>>> list2= ["something", "else", "to", "sort"] ，# 对 另 一 个 列表 内 容 进 行 排序 
>>> pairs= zip(listl,1ist2) # 把 两 个 列表 中 的 对 应 位 置 元 素 配对 
>>> [item[1] for item in sorted (pairs, key= lambda x:x[0], reverse= True) 
['samething', 'to', 'sort', 'else'] 
>>>2 [[1,2,3], [2,1,4], [2,2,1]] 
>>> sorted (x, key= lanbda item: (item[1],- item[2])) 
# 以 第 2 个 元 素 升序 
# 第 3 个 元 素 降序 排序 
# 这 里 的 负 号 只 适用 于 数值 型 元 素 





[[2,1,4], [1,2,3], [2,2,1]] 
>>> 季 [raaaav ‘be', 'd', 'b', ‘ba'] 
>>> sorted (x, key= lanbda item: (len(item),item)) 
# 先 按 长 度 排序 ,长 度 一 样 的 正常 排序 
['b','d', ‘ba', ‘be', ‘aaaa'] 


5. copy() 


列表 对 象 的 copy() 方 法 返回 列表 的 浅 复制 。 所 谓 浅 复制 ,是 指 生成 一 个 新 的 列表 ， 
并 且 把 原 列表 中 所 有 元 素 的 引用 都 复制 到 新 列表 中 。 如 果 原 列表 中 只 包含 整数 、 实 数 、 复 
数 等 基本 类 型 或 元 组 、 字 符 串 这 样 的 不 可 变 类 型 的 数据 ,一 般 是 没有 问题 的 。 但 是 ,如 果 
原 列表 中 包含 列表 之 类 的 可 变数 据 类 型 ,由 于 浅 复制 时 只 是 把 子 列表 的 引用 复制 到 新 列 
表 中 ,于 是 修改 任何 一 个 都 会 影响 男 外 一 个 。 


>>> 二 [1,2, [3,4]] # 原 列表 中 包含 子 列表 
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>>> yx.oopy() # 浅 复制 
>>>y # 两 个 列表 中 的 内 容 看 起 来 完全 一 样 
[1,2, [3,4]] 
>>> y[2] .append (5) # 为 新 列表 中 的 子 列表 追加 元 素 
>>>x[0]=6 # 整 数 .实数 等 不 可 变 类 型 不 受 此 影响 
>>> y.append(6) # 在 新 列表 尾部 追加 元 素 
>>>y 
[1,2, [3,4,5],6] 
>>>x # 原 列表 不 受 影响 


[6,2, [3,4,5]] 


列表 对 象 的 copy() 方 法 和 切片 操作 以 及 标准 库 copy 中 的 copy0 〇 0 函数 一 样 都 是 返回 
浅 复制 ,如 果 想 避免 上 面 代码 演示 的 问题 ,可 以 使 用 标准 库 copy 中 的 deepcopy() 柄 数 实 
现 深 6 复制 。 所 谓 深 复制 ,是 指 对 原 列表 中 的 元 素 进行 递归 ,把 所 有 的 值 都 复制 到 新 列表 
中 ,对 嵌 套 的 子 列表 不 再 是 复制 引用 。 这 样 一 来 ,新 列表 和 原 列表 是 互相 独立 ,修改 任何 
一 个 都 不 会 影响 另外 一 个 。 

>>> import opy 

>>> 交 [1,2, [3,4]] 

>>> y= copy.deepcopy (x) # 深 复制 

>>>x[2] .append(5) # 为 原 列表 中 的 子 列表 追加 元 素 

>>> y.append (6) # 在 新 列表 尾部 追加 元 素 

>>>Y 

[1,2, [3,4],6] 

>>>x 

[1,2, [3,4,5]] 


不 论 是 浅 复制 还 是 深 复制 ,与 列表 对 象 的 直接 赋值 都 是 不 一 样 的 情况 。 下 面 的 代码 
把 同一 个 列表 赋值 给 两 个 不 同 的 变量 ,这 两 个 变量 是 互相 独立 的 ,修改 任何 一 个 都 不 会 影 
响 另 外 一 个 。 


>>> 交 [1,2, [3,4]] 


>>>y [1,2, [3,4]] # 把 同一 个 列表 对 象 赋值 给 两 个 变量 
>>> x.append (5) 
>>> x[2] .append (6) # 修 改 其 中 一 个 列表 的 子 列表 


>>>x 

[1,2, [3,4,6],5] 

>>>Y # 不 影响 另外 一 个 列表 
[1,2, [3,4]] 


下 面 的 代码 演示 的 是 另外 一 种 情况 .把 一 个 列表 变量 赋值 给 另外 一 个 变量 ,这 样 两 个 
变量 指向 同一 个 列表 对 和 象 . 对 其 中 一 个 做 的 任何 修改 都 会 立刻 在 另外 一 个 变量 得 到 体现 。 
>>> 基 [1,2, [3,4]] 


>>> 交工 # 两 个 变量 指向 同一 个 列表 
>>> x[2] .append (5) 
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>>> x.append(6) 

>>>x[0]=7 

>>>x 

[7,2, [3,4,5],6] 

>>>y # 对 x 做 的 任何 修改 ,y 都 会 受到 影响 
[7,2, [3,4,5],6] 


314 列表 对 象 支 持 的 运算 符 


加 法 运算 符 (十 ) 也 可 以 实现 列表 增加 元 素 的 目的 ,但 这 个 运算 符 不 属于 原 地 操作 ,而 
是 返回 新 列表 ,并 且 涉 及 大 量 元 素 的 复制 ,效率 非常 低 。 使 用 复合 赋值 运算 符 十 一 实现 列 
表 追 加 元 素 时 属于 原 地 操作 ,与 append() 方 法 一 样 高 效 。 


>>> 丰 [1,2,3] 

>>> id(x) 

53868168 

>>> 关 对 [4 # 连 接 两 个 列表 
>>>x 

[1,2,3,4] 

>>> id(x) # 内 存 地 址 发 生 改 变 
53875720 

>>> 对 = [5 # 为 列表 追加 元 素 
>>>x 

D234 

>>> 这 四 # 内 存 地 址 不 变 
53875720 


乘法 运算 符 * 可 以 用 于 列表 和 整数 相 乘 ,表示 序列 重复 ,返回 新 列表 ,从 一 定 程度 上 来 
说 也 可 以 实现 为 列表 增加 元 素 的 功能 。 与 加 法 运算 符 ( 十 ) 一 样 ,该 运算 符 也 适用 于 元 组 和 
字符 串 。 另 外 ,运算 符 * = 也 可 以 用 于 列表 元 素 重复 ,与 运算 符 十 = 一 样 属于 原 地 操作 。 


>>>= [1,2,3,4] 

>>> id(x) 

54497224 

>>> 二 2 # 元 素 重复 ,返回 新 列表 
>>>x 

[1,2,3,4,1,2,3,4] 

>>> id 四 # 地 址 发 生 改 变 
54603912 

>>> 志 =2 # 元素 重复 , 原 地 进行 
>>>x 

[1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4] 

>>>id(x) # 地 址 不 变 

54603912 
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>>> [1,2,3]*0 # 重 复 0 次 ,清空 
0 
成 员 测 试 运算 符 in 可 用 于 测试 列表 中 是 否 包含 某 个 元 素 ,查询 时 间 随 着 列表 长 度 的 
增加 而 线性 增加 ,而 同样 的 操作 对 于 集合 而 言 则 是 常数 级 的 。 


>>>3 in [1,2,3] 
True 
33] 
False 


315 内 置 函 数 对 列表 的 操作 


除了 列表 对 象 自身 方法 之 外 ,很 多 Python 内 置 函数 也 可 以 对 列表 进行 操作 。 例 如 ， 
max() ,min() 函 数 用 于 返回 列表 中 所 有 元 素 的 最 大 值 和 最 小 值 ,sum() 函 数 用 于 返回 列 
表 中 所 有 元 素 之 和 ,len() 函 数 用 于 返回 列表 中 元 素 的 个 数 ,zip() 函 数 用 于 将 多 个 列表 中 
元 素 重新 组 合 为 元 组 并 返回 包含 这 些 元 组 的 zip 对 象 ,enumerate() 函 数 返 回 包 含 若干 下 
标 和 值 的 迭代 对 象 ,map() 函数 把 函数 映射 到 列表 上 的 每 个 元 素 ,filter() 函 数 根据 指定 函 
数 的 返回 值 对 列表 元 素 进行 过 滤 ,all() 函 数 用 来 测试 列表 中 是 否 所 有 元 素 都 等 价 于 
True,any() 函 数 用 来 测试 列表 中 是 否 有 等 价 于 True 的 元 素 。 


>>>x list (range (11)) # 生 成 列表 

>>> import randem 

>>> randem. shuffle (x) # 打 乱 列 表 中 元 素 的 顺序 
>>>x 

[0,6,10,9,8,7,4,5,2,1,3] 

>>>all (x) # 测 试 是 否 所 有 元 素 都 等 价 于 True 
False 

>>> any (x) # 测 试 是 否 存在 等 价 于 True 的 元 素 
True 

>>> max (x) # 返 回 最 大 值 

10 

>>> max (x, key= str) # 按 指定 规则 返回 最 大 值 
9 

>>>min (x) 

0 

>>> sum(x) # 所 有 元 素 之 和 

55 

>>> len (x) # 列 表 元 素 个 数 

11 

>>> list (zip(x, [1] * 11)) # 多 列表 元 素 重新 组 合 
[(0,D), (6,1), (10,1), (9,1), (8,1), (7,D), (4,1), (5,D), (2,1), (1,1), (3,1)] 


>>> List (zip (range (1,4))) #zip() 函 数 也 可 以 用 于 一 个 序列 或 迭代 对 象 
[(1,), (2,),(3,)] 
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>>> List (zip(['a', 'b','c"'], [1,2])) # 如 果 两 个 列表 不 等 长 , 则 以 短 的 为 准 
[('a',l), (b',2)] 
>>> enumerate (x) ## 枚 举 列表 元 素 ,返回 enumerate 对 象 
< enumerate cbject at 0x00000000030R9120> 
>>> list enmerate (x)) #enumerate 对 象 可 以 转换 为 列表 、 元 组 、 集 合 
[(0,0), (1,6), (2,10), (3,9), (4,8), (5,7), (6, 9 (7,5), (8,2), (9,1), (10,3)] 


316 列表 推导 式 语法 与 应 用 案例 


列表 推导 式 (list comprehension) 也 称 为 列表 解析 式 , 可 以 使 用 非常 简洁 的 方式 对 列 
表 或 其 他 可 迭代 对 象 的 元 素 进 行 遍 历 . 过 滤 或 再 次 计算 ,快速 生成 满足 特定 需求 的 新 列 
表 , 代 码 非常 简洁 ,具有 很 强 的 可 读 性 ,是 Python 程序 开发 时 应 用 最 多 的 技术 之 一 。 
Python 的 内 部 实现 对 列表 推导 式 做 了 大 量 优化 ,可 以 保证 很 快 的 运行 速度 ,也 是 推荐 使 
用 的 一 种 技术 。 列 表 推 导 式 的 语法 形式 为 
[expression for exprl in sequencel if conditionl 
for expr2 in sequence2 if conditicn2 
for expr3 in sequence3 if condition3 
二 
列表 推导 式 在 逻辑 上 等 价 于 一 个 循环 语句 ,只 是 形式 上 更 加 简洁 。 例 如 : 
>>> aList= [xx x for x in range(10)] 
相当 于 


>>> aList= [] 
>>> for x in range (10): 
aList.append (x* x) 


再 如 : 
>>> freshfruit= [' banana',' loganberry ', "passicn fruit '] 
>>> aList= [w.strip() for w in freshfruit] 


等 价 于 下 面 的 代码 : 


>>> aList= [] 
>>> for item in freshfruit: 
aList.append (item.strip()) 


当然 也 等 价 于 : 


>>> aList= list (map (lanbda x: x.strip(), freshfruit)) 





或 


>>> alist= list (map (str.strip, freshfruit)) 
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大 家 应 该 听 过 一 个 故事 ,说 的 是 阿 凡 提 (也 有 的 说 是 阿 基 米 德 ) 与 国王 比赛 下 棋 ,国王 
说 要 是 自己 输 了 阿 凡 提 想 要 什么 他 都 可 以 拿 得 出 来 。 阿 凡 提 说 那 就 要 点 米 吧 ,棋盘 一 共 
64 个 小 格子 ,在 第 一 个 格子 里 放 1 粒 米 ,第 二 个 格子 里 放 2 粒 米 , 第 三 个 格子 里 放 4 粒 
米 , 第 四 个 格子 里 放 8 粒 米 。 以 此 类 推 ,后 面 每 个 格子 里 的 米 都 是 前 一 个 格子 里 的 2 倍 ， 
一 直 把 64 个 格子 都 放 满 。 那 么 到 底 需要 多 少 粒 米 呢 ? 使 用 列表 推导 式 再 结合 内 置 函 数 
sum() 就 很 容易 知道 答案 。 


>>> sum([2xx#i for i in range(64)]) 
18446744073709551615 


按 一 斤 大 米 约 26 000 粒 计算 ,为 放 满 棋盘 ,需要 大 概 3500 亿 吨 大 米 。 结 果 可 想 而 
知 ,最 后 国王 没有 办 法 拿 出 那么 多 米 。 
接 下 来 再 通过 几 个 示例 来 进一步 展示 列表 推导 式 的 强大 功能 。 


1. 实现 嵌 套 列表 的 平 铺 


>>> vec= [[1,2,3], [4,5,6], [7,8,9]] 
>>> [num for elem in vec for num in elem] 
[1,2,3,4,5,6,7,8,9] 


在 这 个 列表 推导 式 中 有 两 个 循环 ,其 中 第 一 个 循环 可 以 看 作 外 循环 ,执行 得 慢 ;第 二 
个 循环 可 以 看 作 内 循环 ,执行 得 快 。 上 面 代码 的 执行 过 程 等 价 于 下 面 的 写法 ; 


>>> vec= [[1,2,3], [4,5,6], [7,8,9]] 
>>> result= [] 
>>> for elem in vec: 
for num in elem: 
result .append (num) 
>>> result 
[1,2,3,4,5,6,7,8,9] 


>>> list (chain ( vec)) 
[1,2,3,4,5,6,7,8,9] 


当然 ,这 里 演示 的 只 是 一 层 嵌 套 列 表 的 平 铺 , 如 果 有 多 级 嵌 套 或 者 不 同 子 列表 艇 套 深 
度 不 同 , 就 不 能 使 用 上 面 的 方法 了 。 这 时 ,可 以 使 用 函数 递归 实现 。 


def flatList (1st): 


result= [] # 存 放 最 终结 果 的 列表 
def nested (1st) : # 函数 嵌 套 定义 
for item in 1st: 
证 isinstance (item, 1ist) : 
nested (item # 递 归 子 列表 
else: 


result.append (item)# 扁 平 化 列表 
nested (1st) # 调 用 徐 套 定义 的 函数 


Se 
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属 


retumn result # 返 回 结果 


2. 过 滤 不 符合 条 件 的 元 素 


在 列表 推导 式 中 可 以 使 用 庄子 句 对 列表 中 的 元 素 进 行 筛选 ,只 在 结果 列表 中 保留 符 
合 条 件 的 元 素 。 下 面 的 代码 可 以 列 出 当前 文件 夹 下 所 有 Python 源 文件 : 


>>> import os 
>>> [filename for filename in os.listdir('.') if filename.endswith(('.py',' .pyw'))] 


下 面 的 代码 用 于 从 列表 中 选择 符合 条 件 的 元 素 组 成 新 的 列表 : 


>>> alist= [- 1,- 4,6,7.5,- 2.3,9,- 11] 
>>> [i for i in aList if i>0] # 所 有 大 于 0 的 数字 
[6,7.5,9] 


再 如 ,已 知 有 一 个 包含 一 些 同 学 成 绩 的 字典 ,现在 需要 计算 所 有 成 绩 的 最 高 分 .最 低 
分 .平均 分 ,并 查找 所 有 最 高 分 同学 ,代码 可 以 这 样 编写 : 


>>> scores= {"Zhang San": 45, "Li Si": 78, "Wang Wan: 40, "Zhou Liu": 96, 
"Zhao Qi": 65, "Sun Ba": 90, "zheng Jiu": 78, "Wu Shi": 99, 
"Dong Shiyi": 60} 

>>> highest=max (scores.values()) # 最 高 分 

>>> lowest=min (scores.values()) # 最 低 分 

>>> average= sum(scores.values())/len(scores) ”# 平 均 分 

>>> highest, lowest, average 

(99, 40,72.33333333333333) 

>>> highestPersor= [name for name, score in soores.items () if score== highest] 

>>> highestPerson 

['Wa Shi'] 


与 上 面 的 代码 功能 类 似 ,下 面 的 代码 使 用 列表 推导 式 查 找 列表 中 最 大 元 素 的 所 有 
位 置 : 


>>> fram randcm jimport randint 

>>> 2 [randint (1,10) for i in range (20)] # 20 个 介 于 [1,10] 的 整数 
>>>x 

[10,2,3, 4,5,10, 10, 9, 2, 4,10, 8,2,2,9,7, 6,2,5, 6] 

>>> me max (x) 

>>> [index for index,value in enumerate (x) if value==m] # 最 大 整数 的 所 有 出 现 
位 置 

[0,5,6,10] 


3. 同时 遍历 多 个 列表 或 可 迭代 对 象 


>>> [(x,y) for x in [1,2,3] for yin [3,1,4] if x !=y] 
[(1,3), (lv 2,3), (2,1), (2,4), (3,D), (3,4)] 
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>>> [(x,y) for x in [1,2,3] if ==1 fory in [3,1,4] if y!=x] 
[(1,3), (1,4)] 


对 于 包含 多 个 循环 的 列表 推导 式 , 一 定 要 清楚 多 个 循环 的 执行 顺序 或 “ 肉 套 关系 ”。 
例如 ,上 面 第 一 个 列表 推导 式 等 价 于 


>>> result= [] 
>>> for x in [1,2,3]: 
for y in [3,1,4]: 
ifx =y: 
result.append ( (x,y)) 
>>> result 
[(1,3), (1,4), (2,3), (2,1), (2,4), (3,1), (3,4)] 


4. 使 用 列表 推导 式 实 现 矩阵 转 置 


>>> matrix= [[1,2,3,4], [5,6,7,8], [9,10,11,12]] 
>>> [[row[i] for row in matrix] for i in range (4)] 
[[1,5,9], [2,6,10], [3,7,11], [4,8,12]] 


对 于 嵌 套 了 列表 推导 式 的 列表 推导 式 ,一 定 要 清楚 其 执行 顺序 。 例 如 ,上 面 列表 推导 
式 的 执行 过 程 等 价 于 下 面 的 代码 


>>> matrix= [[1,2,3,4], [5,6,7,8], [9,10,11,12]] 
>>> result= [] 
>>> for i in range (len (matrix[0])): 

result .append ([row[i] for row in matrix]) 
>>> result 
[[1,5, 9], [2,6,10], [3,7,11], [4,8,12]] 


如 果 把 内 层 的 列表 推导 式 也 展开 ,完整 的 执行 过 程 可 以 通过 下 面 的 代码 来 模拟 : 


>>>matrix= [ [1,2,3,4], [5,6,7,8], [9,10,11,12]] 
>>> result= [] 
>>> for i in range (len (matrix[0])): 

te [] 

for row in matrix: 

temp.append (row [i]) 

result .append (terp) 

>>> result 


[[1,5,9], [2,6,10], [3,7,11], [4,8,12]] 
当然 ,也 可 以 使 用 内 置 函 数 zip() 和 list() 来 实现 矩阵 转 置 ; 


>>> list (map (list,zip(# matrix))) 
[[1,5,9], [2,6,10], [3,7,11], [4,8,12]] 
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5. 列表 推导 式 中 可 以 使 用 函数 或 复杂 表达 式 


>>> def flw: 
迁 响 六 =0: 
ww*2 
else: 
wl 
retumv 
>>>print ([f(v) forv in [2,3,4,-1] if v>0]) 
[4,4,16] 
>>>print ([w*2 庄 几 并 =0elsevlforvin [2,3,4,- 1] if vw>0]) 
[4,4,16] 


6. 列表 推导 式 支 持 文件 对 象 迭 代 


>>> with apen ('C:\\RHDSetup.10g', 'r') as fp: # 为 节约 篇 幅 , 略 去 输出 
结果 
print ([line for line in fp]) 


7. 使 用 列表 推导 式 生 成 100 以 内 的 所 有 素数 


>>> [p for p in range (2,100) if 0 not in [p% d for d in range(2,int (sqrt (p))+1)]] 
[2,3,5,7,11,13,17,19,23,29, 31, 37, 41, 43, 47,53, 59, 61, 67,71, 73, 79, 83, 89, 97] 


317 切片 操作 的 强大 功能 


切片 是 Python 序列 的 重要 操作 之 一 ,除了 适用 于 列表 之 外 ,还 适用 于 元 组 ,字符 串 、 
range 对 象 ,但 列表 的 切片 操作 具有 最 强大 的 功能 。 不 仅 可 以 使 用 切片 来 截取 列表 中 的 
任何 部 分 返回 得 到 一 个 新 列表 ,也 可 以 通过 切片 来 修改 和 删除 列表 中 部 分 元 素 ,甚至 可 以 
通过 切片 操作 为 列表 对 象 增加 元 素 。 

在 形式 上 ,切片 使 用 2 个 冒号 分 隔 的 3 个 数字 来 完成 。 

[start:end:step] 
其 中 ,3 个 数字 的 含义 与 内 置 函数 range(start，end，step) 完 全 一 致 ,第 一 个 数字 start 表 
示 切 片 开始 的 位 置 .默认 为 0; 第 二 个 数字 end 表示 切片 截止 (但 不 包含 ) 的 位 置 (默认 为 
列表 长 度 ) ;第 三 个 数字 step 表示 切片 的 步 长 (默认 为 1) 。 当 start 为 0 时 可 以 省 略 , 当 
end 为 列表 长 度 时 可 以 省 略 , 当 step 为 1 时 可 以 省 略 ,省 略 步 长 时 还 可 以 同时 省 略 最 后 一 
个 冒号 。 另 外 , 当 step 为 负 整 数 时 ,表示 反 向 切片 ,这 时 start 应 该 在 end 的 右 侧 才 行 。 

1. 使 用 切片 获取 列表 的 部 分 元 素 


使 用 切片 可 以 返回 列表 中 部 分 元 素 组 成 的 新 列表 。 与 使 用 索引 作为 下 标 访问 列表 元 
素 的 方法 不 同 ,切片 操作 不 会 因为 下 标 越界 而 抛 出 异常 ,而 是 简单 地 在 列表 尾部 截断 或 者 
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SS 
返回 一 个 空 列表 ,代码 具有 更 强 的 健壮 性 。 


>>> aList= [3,4,5,6,7,9,11,13,15,17] 











>>> aList[::] # 返 回 包含 原 列 表 中 所 有 元 素 的 新 列表 
[3,4,5,6,7,9,11,13,15,17] 

>>>aList[::-1] # 返 回 包含 原 列表 中 所 有 元 素 的 逆序 列表 
[17,15,13,11,9,7,6,5,4,3] 

>>> aList[::2] # 隔 一 个 取 一 个 ,获取 偶数 位 置 的 元 素 
[3,5,7,11,15] 

>>> arist[1::2] # 隔 一 个 取 一 个 ,获取 奇数 位 置 的 元 素 
[4,6,9,13,17] 

>>> aList[3:6] # 指 定 切片 的 开始 和 结束 位 置 

[6,7,9] 

>>> aList [0:100] # 切 片 结束 位 置 大 于 列表 长 度 时 ,从 列表 尾部 截断 
3,4,5,6,7,9,11,13,15, 17] 

>>> aList [100] # 抛 出 异常 ,不 允许 越界 访问 

IndexError: list index out of range 

>>> aList[100:] # 切 片 开 始 位 置 大 于 列表 长 度 时 ,返回 空 列表 
] 

>>> aList[- 15:3] # 进 行 必要 的 截断 处 理 

3,4,5] 

>>> len(aList) 

10 

>>> aList[3:- 10:-1] # 位 置 3 在 位 置 -10 的 右 侧 ,-1 表 示 反 向 切片 
6,5,4] 

>>> aList[3:- 5] # 位 置 3 在 位 置 -5 的 左 侧 , 正 向 切片 

[6,7] 


2. 使 用 切片 为 列表 增加 元 素 

可 以 使 用 切片 操作 在 列表 任意 位 置 插入 新 元 素 , 不 影响 列表 对 象 的 内 存 地址 ,属于 原 
地 操作 。 

>>> aList= [3,5,7] 


>>> aList [len(aList):] 
0 


>>> aList[len (aList):]= [9] # 在 列表 尾部 增加 元 素 

>>> aList[:0]= [1,2] # 在 列表 头 部 插入 多 个 元 素 
>>> aList[3:3]= [4] # 在 列表 中 间 位 置 插入 元 素 
>>> aList 

[1,2,3,4,5,7,9] 


3. 使 用 切片 替换 和 修改 列表 中 的 元 素 


>>> aList= [3,5,7,9] 


.四 
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>>> aList[:3]= [1,2,3] # 蔡 换 列 表 元 素 , 等 号 两 边 的 列表 长 度 相等 
>>> aList 
[1,2,3,9] 
>>> aList[3:]= [4,5,6] # 切 片 连续 ,等 号 两 边 的 列表 长 度 可 以 不 相等 
>>> aList 
[1,2,3,4,5,6] 
>>> aList[::2]= [0] * 3 # 隔 一 个 修改 一 个 
>>>aList 
[0,2,0,4,0,6] 
>>> aList[::2]= ['a', 'b', 'c'] # 隔 一 个 修改 一 个 
>>> aList 
[av2, b',4, 'c',6] 
>>> aList [1::2]= range (3) # 序 列 解 包 的 用 法 
>>> aList 
['a',0, b',1,'c',2] 
>>> aList[1::2]=map (lanbda x: x!= 5, range (3)) 
>>> aList 
['a', True, b', True, 'c', True] 
>>> aList [1::2]= zip('abc', range (3)) #map, filter、zip 对 象 都 支持 这 样 的 用 法 
>>> aList 
[av (‘a',0), b', (b',1),'c', ('c',2)] 
>>> aList[::2]= [1] # 切 片 不 连续 时 等 号 两 边 列表 的 长 度 必须 相等 
ValueError: attempt to assign sequence of size 1 to extended slice of size 3 
4. 使 用 切片 删除 列表 中 的 元 素 
>>> aList= [3,5,7,9] 
>>> aList[:3]=[] # 删 除 列表 中 前 3 个 元 素 
>>> aList 
[9] 
另外 ,也 可 以 使 用 del 命令 与 切片 结合 来 删除 列表 中 的 部 分 元 素 , 并 且 切 片 元 素 可 以 
不 连续 。 
>>> aList= [3,5,7,9,11] 
>>> del aList[:3] # 切 片 元 素 连续 
>>> aList 
[9,11] 
>>> aList= [3,5,7,9,11] 
>>> del aList[::2] # 切 片 元 素 不 连续 , 隔 一 个 删 一 个 
>>> aList 
[5,9] 


5. 切片 得 到 的 是 列表 的 浅 复 制 
在 3.1.3 节 介绍 列表 对 象 的 copy() 方 法 时 曾经 提 到 ,切片 返回 的 是 列表 元 素 的 浅 复 
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制 ,与 列表 对 象 的 直接 赋值 并 不 一 样 , 和 3. 1. 3 节 介 绍 的 深 复制 也 有 本 质 的 不 同 。 


>>> aList= [3,5,7] 
>>>bList=aList[::] 
>>> aList==bList 


>>> aList is bList 


>>> id(aList)== id(oList) 
False 

>>> id(x[0])==id(y[0]) 
True 
>>>bList[1]=8 
>>>bList 

3,8,7] 

>>> aList 

3,5,7] 

>>> 二 [[1], [2], [3]] 
>>> 叶 x[:] 

>>>y 

[1], [2], [3]] 

>>> y[0]= [4] 

>>>y 

[4], [2], [3]] 

>>> y[1] .append (5) 
>>>y 

[4], [2,5], [3]] 
>>>x 

[1], [2,5], [3]] 





# 切 片 , 浅 复制 
# 两 个 列表 的 值 相等 


# 浅 复制 ,不 是 同一 个 对 象 
# 两 个 列表 对 象 的 地 址 不 相等 
# 相 同 的 值 在 内 存 中 只 有 一 份 


# 修 改 HList 列 表 元 素 的 值 不 会 影响 alist 
#bList 的 值 发 生 改 变 


#arist 的 值 没有 发 生 改 变 


# 如 果 列 表 中 包含 列表 或 其 他 可 变 序列 


# 情 况 会 复杂 一 些 


# 直 接 修改 y 中 下 标 为 0 的 元 素 值 ,不 影响 x 


# 通 过 列表 对 象 的 方法 原 地 增加 元 素 


# 列 表 x 也 受到 同样 的 影响 


3.2 元 组 : 轻 量 级 列表 


321 元 组 创建 与 元 素 访问 


列表 的 功能 虽然 很 强大 ,但 负担 也 很 重 ,在 很 大 程度 上 影响 了 运行 效率 。 有 时 并 不 需 
要 那么 多 功能 ,很 希望 能 有 个 轻 量 级 的 列表 ,元 组 (tuple) 正 是 这 样 一 种 类 型 。 在 形式 上 ， 
元 组 的 所 有 元 素 放 在 一 对 圆 括号 中 ,元 素 之 间 使 用 逗号 分 隔 , 如 果 元 组 中 只 有 一 个 元 素 则 
必须 在 最 后 增加 一 个 逗号 。 

>>> 到 (1,2,3) # 直 接 把 元 组 赋值 给 一 个 变量 

>>> type (x) # 使 用 type 0 函数 查 看 变量 的 类 型 

<class 'tuple'> 

>>>x[0] ## 元 组 支持 使 用 下 标 访问 特定 位 置 的 元 素 

1 
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>>>x[-1] # 最 后 一 个 元 素 ,元 组 支持 双向 索引 
3 

>>>x[1]=4 # 元 组 是 不 可 变 的 

TypeError: ‘tuple' cbject dbes not support item assignment 

>>>= G3) # 这 和 =3 是 一 样 的 

>>>x 

a 

>>>= (3,) # 如 果 元 组 中 只 有 一 个 元 素 ,必须 在 后 面 多 写 一 个 逗号 
>>>x 

(3,) 

>>>= () # 空 元 组 

>>>= tuple() # 空 元 组 

>>> tuple (range (5)) # 将 其 他 迭代 对 象 转换 为 元 组 
(0,1,2,3,4) 


除了 上 面 的 方法 可 以 直接 创建 元 组 之 外 ,很 多 内 置 函数 的 返回 值 也 是 包含 了 若干 元 
组 的 可 迭代 对 象 , 如 enumerate() ,zip() 等 。 


>>> list (enumerate (range (5))) 
[(0,0), (1,1), (2,2), (3,3), (4,4)] 
>>> list (zip (range (3), 'abodefg')) 
[(0,'a'), (l,'b'), (2,'c')] 


322 元 组 与 列表 的 异同 点 


列表 和 元 组 都 属于 有 序 序列 ,都 支持 使 用 双向 索引 访问 其 中 的 元 素 ,以 及 使 用 
count() 方 法 统计 元 素 的 出 现 次 数 和 index() 方 法 获取 元 素 的 索引 ,len() .map() ,filter() 
等 大 量 内 置 函数 和 十 、* ,十 三 \in 等 运算 符 也 都 可 以 作用 于 列表 和 元 组 。 虽然 列表 和 元 
组 有 着 一 定 的 相似 之 处 ,但 在 本 质 上 和 内 部 实现 上 都 有 着 很 大 的 不 同 。 

元 组 属于 不 可 变 (immutable) 序 列 , 不 可 以 直接 修改 元 组 中 元 素 的 值 ,也 无 法 为 元 组 
增加 或 删除 元 素 。 所 以 ,元 组 没有 提供 append() .extend() 和 insert() 等 方法 ,无 法 向 元 
组 中 添加 元 素 ;同样 ,元 组 也 没有 remove() 和 pop() 方 法 ,也 不 支持 对 元 组 元 素 进行 del 
操作 ,不 能 从 元 组 中 删除 元 素 , 而 只 能 使 用 del 命令 删除 整个 元 组 。 元 组 也 支持 切片 操 
作 , 但 是 只 能 通过 切片 来 访问 元 组 中 的 元 素 , 而 不 允许 使 用 切片 来 修改 元 组 中 元 素 的 值 ， 
也 不 支持 使 用 切片 操作 来 为 元 组 增加 或 删除 元 素 。 从 一 定 程度 上 讲 , 可 以 认为 元 组 是 轻 
量 级 的 列表 ,或 者 “常量 列表 ”。 

Python 的 内 部 实现 对 元 组 做 了 大 量 优化 .访问 速度 比 列表 更 快 。 如 果 定 义 了 一 系列 
常量 值 , 主 要 用 途 仅 是 对 它们 进行 遍历 或 其 他 类 似 用 途 , 而 不 需要 对 其 元 素 进行 任何 修 
改 , 那 么 一 般 建议 使 用 元 组 而 不 用 列表 。 元 组 在 内 部 实现 上 不 允许 修改 其 元 素 值 ,从 而 使 
得 代码 更 加 安全 。 例 如 ,调用 函数 时 使 用 元 组 传递 参数 可 以 防止 在 函数 中 修改 元 组 ,而 使 
用 列表 则 很 难保 证 这 一 点 。 

最 后 ,作为 不 可 变 序列 ,与 整数 .字符 串 一 样 , 元 组 可 用 作 字 典 的 键 , 也 可 以 作为 集合 
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的 元 素 。 而 列表 则 永远 都 不 能 当 作 字 典 键 使 用 .也 不 能 作为 集合 中 的 元 素 , 因 为 列表 是 可 
变 的 。 内 置 函数 hash() 可 以 用 来 测试 一 个 对 象 是 否 可 哈 希 。 一 般 来 说 ,并 不 需要 关心 该 
函数 的 返回 值 具体 是 什么 ,重点 是 对 象 是 否 可 喻 希 ,如果 对 象 不 可 喻 希 会 抛 出 异常 。 

>>>hash((1,)) # 元 组 ,数字 、 字 符 串 都 是 可 哈 希 的 

3430019387558 

>>> hash (3) 

3 

>>> hash ('hello world.') 

— 4012655148192931880 

>>> hash([1,2]) # 列 表 不 可 哈 希 

TypeError: unhashable type: 'list' 


323 生成 器 推导 式 


生成 器 推导 式 也 称 为 生成 器 表达 式 (generator expression) ,用 法 与 列表 推导 式 非 常 
相似 ,在 形式 上 生成 器 推导 式 使 用 圆 括号 (parentheses) 作 为 定 界 符 , 而 不 是 列表 推导 式 
所 使 用 的 方 括号 (square brackets)。 与 列表 推导 式 最 大 的 不 同 是 ,生成 器 推导 式 的 结果 
是 一 个 生成 器 对 象 。 生 成 器 对 象 类 似 于 迭代 器 对 象 ,有 具有 惰性 求 值 的 特点 ,只 在 需要 时 生 
成 新 元 素 , 比 列表 推导 式 具有 更 高 的 效率 ,空间 占用 非常 少 ,尤其 适合 大 数据 处 理 的 场合 。 

使 用 生成 器 对 象 的 元 素 时 ,可 以 将 其 转化 为 列表 或 元 组 ,也 可 以 使 用 生成 器 对 象 的 
__next__0 〇 方法 或 者 内 置 函 数 next() 进 行 遍历 ,或 者 直接 使 用 for 循环 来 遍历 其 中 的 元 
素 。 但 是 不 管用 哪 种 形式 ,只 能 从 前 往 后 正 向 访问 其 中 的 元 素 ,没有 任何 方法 可 以 再 次 访 
问 己 访问 过 的 元 素 ,也 不 支持 使 用 下 标 访问 其 中 的 元 素 。 当 所 有 元 素 访 问 结束 以 后 ,如 果 
需要 重新 访问 其 中 的 元 素 ,必须 重新 创建 该 生成 器 对 象 。enumerate、filter、map、zip 等 对 
象 也 具有 同样 的 特点 。 最 后 ,包含 yield 语句 的 函数 也 可 以 用 来 创建 生成 器 对 象 , 详 见 
第 5 章 。 


>>> gr ((i+2)x#x2 for i in range (10)) # 创 建生 成 器 对 象 


>>>g 

< generator cbject< genexpr> at Qx0000000003095200> 

>>> tuple(g) # 将 生成 器 对 象 转换 为 元 组 
(4,9,16,25,36,49, 64, 81, 100, 121) 

>>> list (g) # 生 成 器 对 象 已 遍历 结束 ,没有 元 素 了 


0 

>>> gq ((i+2)xx2 for i in range (10)) # 重 新 创建 生成 器 对 象 

>>>g. next _() # 使 用 生成 器 对 象 的 ”_next_ _() 方 法 获取 元 素 
4 

>>>g. next _() # 获 取 下 一 个 元 素 

9 

>>> next g) # 使 用 函数 next 0 获取 生成 器 对 象 中 的 元 素 

16 


SS 
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>>> 9 ((i+ 2)x**2 for i in range(10)) 

>>> for item in g: ## 使 用 循环 直接 遍历 生成 器 对 象 中 的 元 素 
print (item,end= ' ') 

4 9 16 25 36 49 64 81 100 121 

>>> 且 flter (None, range (20)) #filter 对象 也 具有 类 似 的 特点 

>>>1l1inx 

True 

S951 

True 

>>>2 inx # 不 可 再 次 访问 已 访问 过 的 元 素 

False 

>>> = map (str, range (20)) #map 对 象 也 具有 类 似 的 特点 

>>> "0' inx 

True 

>>> '0' inx # 不 可 再 次 访问 已 访问 过 的 元 素 

False 


3.3 字典 : 反映 对 应 关系 的 映射 类 型 


字典 (dict) 是 包含 若干 * 键 : 值 ?元 素 的 无 序 可 变 序 列 , 字 典 中 的 每 个 元 素 包含 用 冒号 
分 隔 开 的 “ 键 ? 和 ” 值 ?两 部 分 ,表示 一 种 映射 或 对 应 关系 ,也 称 为 关联 数组 。 定 义 字典 时 ， 
每 个 元 素 的 “ 键 " 和 “ 值 ”之 间 用 冒号 分 隔 , 不 同 元 素 之 间 用 逗号 分 隔 , 所 有 的 元 素 放 在 一 对 
大 括号 “{}” 中 。 

字典 中 元 素 的 * 键 "可 以 是 Python 中 任意 不 可 变数 据 , 如 整数 .实数 .复数 .字符 串 .元 
组 等 类 型 的 可 哈 希 数据 ,但 不 能 使 用 列表 、 集 合 . 字 典 或 其 他 可 变 类 型 作为 字典 的 “ 键 ”。 
另外 ,字典 中 的 “ 键 " 不 允许 重复 ,“ 值 "是 可 以 重复 的 。 字 典 在 内 部 维护 的 哈 希 表 使 得 检索 
操作 非常 快 。 使 用 内 置 字典 类 型 dict 时 不 要 太 在 乎 元 素 的 先后 顺序 ,如 果 确 实在 乎 元 素 
顺序 可 以 使 用 collections 的 OrderedDict 类 。 值 得 一 提 的 是 ,在 Python 3. 6 中 又 对 内 置 
类 型 dict 进行 了 优化 , 比 Python 3. 5.x 大 概 能 节约 20% 一 25% 的 内 存 空间 。 


331 字典 创建 与 删除 
使 用 赋值 运算 符 “=” 将 一 个 字典 赋值 给 一 个 变量 即 可 创建 一 个 字典 变量 。 


>>> aDict= {'server': 'db.diveintopython3.org', 'database': ‘mysql'} 

也 可 以 使 用 内 置 类 dict 以 不 同形 式 创建 字典 ,在 第 2 章 曾经 介绍 过 这 种 用 法 ,实际 上 
是 调用 了 dict 类 的 构造 方法 。 

>>> 六 dict() # 空 字典 

>>> 交 全 # 空 字典 

>>> keys= [av b', 'c', 'd'] 

>>> values= [1,2,3,4] 
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四 
>>> dictionary dict (zip (keys,values)) ## 根 据 已 有 数据 创建 字典 
>>> d= dict (name= 'Dong',age= 39) # 以 关键 参数 的 形式 创建 字典 
>>> aDict= dict.framkeys (['name', 'age', 'sex']) 
# 以 给 定 内 容 为 “ 键 ” 
## 创 建 < 值 为 空 的 字典 
>>> aDict 


{'name': None, 'age': None 'sex': None} 
与 其 他 类 型 的 对 象 一 样 , 当 不 再 需要 时 ,可 以 直接 删除 字典 ,不 再 著述 。 
332 字典 元 素 的 访问 


字典 中 的 每 个 元 素 表示 一 种 映射 关系 或 对 应 关系 ,根据 提供 的 * 键 "作为 下 标 可 以 访 
问 对 应 的 “ 值 ”, 如 果 字 典 中 不 存在 这 个 “ 键 " 会 抛 出 异常 。 


>>> aDict= {'age': 39, "score': [98,97], 'name': 'Dong','sex': 'male'} 


>>> aDict['age'] # 指 定 的 “ 键 ”存在 ,返回 对 应 的 “ 值 ” 
39 
>>> aDict['address'] # 指 定 的 “ 键 " 不 存在 , 抛 出 异常 


KeyError: 'address' 


为 了 避免 程序 运行 时 引发 异常 而 导致 崩溃 ,在 使 用 下 标的 方式 访问 字典 元 素 时 ,最 好 
配合 条 件 判断 或 者 异常 处 理 结构 。 


>>> aDict= {'age': 39, 'soore': [98,97], 'name': 'Dong' "sex': 'male'} 

>>> if 'Age' in apict: # 首 先 判 断 字 典 中 是 否 存在 指定 的 “ 键 ” 
Print (apict[ "age ]) 

else: 
print ('Not Exists.') 


Not Exists. 
>>> try: # 使 用 异常 处 理 结构 
Print (aDict ['address']) 
except: 
Print ('Not Exists.') 


Not Exists. 
字典 对 象 提供 了 一 个 get0 〇 ) 方 法 用 来 返回 指定 “ 键 " 对 应 的 “ 值 ”, 并 且 允 许 指 定 该 键 
不 存在 时 返回 特定 的 “ 值 ”。 例 如 : 


>>> aDict.get ('age') # 如 果 字 典 中 存在 该 “ 键 " 则 返回 对 应 的 “ 值 ” 
39 

>>> aDict .get (adtress' 'Not Exists.') # 指 定 的 “ 键 ? 不 存在 时 返回 指定 的 默认 值 
"Not Exists." 


>>> import string 
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>>> import randem 
>>>» string.ascii letterst string.digits 
>>> 二 .join((random.choice (x) for i in range(1000))) # 生 成 1000 个 随机 字符 


>>>d=dict() 

>>> for ch in z: # 遍 历 字符 串 ,统计 频次 
df[ch]=d.get (ch,0)+1 

>>> for kv in sorted(d.items()): # 查 看 统计 结果 
Print (k,':",v) 


字典 对 象 的 setdefault() 方 法 用 于 返回 指定 “ 键 ”" 对 应 的 “ 值 ”, 如 果 字典 中 不 存在 该 
“ 键 ”就 添加 一 个 新 元 素 并 设置 该 " 键 ? 对 应 的 “ 值 ”默认 为 None) 。 


>>> aDict.setdefault (‘address', 'SDIBT') # 增 加 新 元 素 

‘SDIBT' 

>>> aDict 

{'age': 39, 'soore': [98,97], "name': 'Dong', 'adiress': 'SDIBT' 'sex': "male 中 


对 字典 对 象 直接 进行 迭代 或 者 遍历 时 默认 是 遍历 字典 的 “ 键 ”, 如 果 需 要 遍历 字典 的 
元 素 必须 使 用 字典 对 象 的 items() 方 法 明确 说 明 ,如果 需 要 遍历 字典 的 “ 值 ” 则 必须 使 用 字 
典 对 象 的 values() 方 法 明确 说 明 。 当 使 用 len()、max()、min()、sum()、 sorted()、 
enumerate()、map() ,filter( ) 等 内 置 函数 以 及 成 员 测试 运算 符 in 对 字典 对 象 进行 操作 
时 ,也 遵循 同样 的 约定 。 


>>> aDict= {'age': 39, "score': [98,97], "name': 'Dong', 'sex': male'} 

>>> for item in aDict: # 默 认 遍历 字典 的 “ 键 ” 
print (item,end= ' ') 

age score name sex 

>>> for item in aDict.items(): # 明 确 指 定 遍 历 字典 的 元 素 
print (item,end= " ') 

("age',39) ("soore', [98,97]) (‘name', 'Dong') ('sex', 'male') 

>>> aDict.items () 

ict items([('age',37), ('soore', [98,97]), (‘name', 'Dong'), ('sex', ‘male')]) 

>>> aDict.keys () 

dict keys(['age', 'score', name' 'sex']) 

>>> aDict.values () 

dict_ values([37, [98,97], "Dong' male']) 


333 元 素 的 添加 、 修 改 与 删除 


当 以 指定 “ 键 ? 为 下 标 为 字典 元 素 赋值 时 ,有 两 种 含义 : 四 若 该 键 " 存 在 , 则 表示 修改 该 
“ 键 ”对 应 的 值 ; @ 若 该 “ 键 "不 存在 , 则 表示 添加 一 个 新 的 “ 键 : 值 ”对 ,也 就 是 添加 一 个 新 元 素 。 

>>> aDict= {'age': 35, "name': ‘Dong', 'sex': ‘male'} 

>>> aDict['age']=39 # 修 改元 素 值 

>>> aDict ['addiress']= 'SDIBT" # 添 加 新 元 素 
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SS 
>>> aDict # 使 用 字典 时 并 不 需要 太 在 意 元 素 的 顺序 

{"age': 39, 'address': 'SDIBT' "name': "Dong' 'sex': "rale'} 

使 用 字典 对 象 的 updateO 〇 方法 可 以 将 另 一 个 字典 的 “ 键 : 值 ”一 次 性 全 部 添加 到 当前 
字典 对 象 , 如 果 两 个 字典 中 存在 相同 的 “ 键 ”, 则 以 另 一 个 字典 中 的 “ 值 ”为 准 对 当前 字典 进 
行 更 新 。 

>>> aDict= {'age': 37, "score': [98,97], "name': "Dong' 'sex': male'} 

>>> aDict .update ({'a':97, 'age':39}) # 修 改 'age' 键 的 值 ,同时 添加 新 元 素 'a':97 

>>> aDict 

{"'score': [98,97], 'sex': male', 'a': 97,'age': 39, name': 'Dong'} 

字典 对 象 的 setdefault() 方 法 也 可 以 用 来 为 字典 添加 新 元 素 ,3. 3. 2 节 中 已 经 介绍 了 
该 方法 的 用 法 。 如 果 需 要 删除 字典 中 指定 的 元 素 ,可 以 使 用 del 命令 。 


>>> del aDict['age'] # 删除 字典 元 素 
>>> aDict 





{'"score': [98,97],'sex': "male''a': 97,'name': 'Dong'} 
字典 对 象 的 pop() 和 popitem() 方 法 可 以 弹出 并 删除 指定 的 元 素 。 


>>> aDict= {'age': 31, "score': [98,97],'name': 'Dong' 'sex': "male'} 


>>> aDict .popitem() # 弹 出 一 个 元 素 ,对 空 字典 会 抛 出 异常 
('age',37) # 在 Pythen 3.6.x 中 结果 略 有 不 同 , 这 是 正常 的 
>>> aDict.pop ('sex') # 弹 出 指定 键 对 应 的 元 素 

ia 

>>> aDict 


{f"score': [98,97], 'name': 'Dong'} 


字典 对 象 的 clear() 方 法 用 于 清空 字典 对 象 中 的 所 有 元 素 ;copy() 方 法 返回 字典 对 象 
的 浅 复 制 , 关 于 浅 复制 的 介绍 请 参考 3. 1. 3 节 的 介绍 。 


334 标准 库 cqlections 中 与 字典 有 关 的 类 


Python 标准 库 中 提供 了 很 多 扩展 功能 ,大 幅度 提高 了 开发 效率 。 这 里 主要 介绍 
collections 中 OrderedDict 类 、defaultdict 类 和 Counter 类 ,deque、namedtuple 以 及 其 他 
更 多 的 类 将 在 后 面 章节 中 介绍 。 


1. OrderedDict 类 


Python 内 置 字典 dict 是 无 序 的 ,如 果 需 要 一 个 可 以 记 住 元 素 插 入 顺序 的 字典 ,可 以 
使 用 collections. OrderedDict 。 


>>> import collections 

>>> 六 collections.OrderedDict() # 有 序 字典 
>>>x['a']=3 

>>>x['b']=5 
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>>>x['c']=8 
>>>x 
OrderedDict ([('a',3), ('b',5), ('c',8)]) 


2. defaultdict 类 


3.3.2 节 中 字母 出 现 频次 统计 的 问题 ,也 可 以 使 用 collections 模块 的 defaultdict 类 


>>> import string 
>>> import randem 
>>>2 string.ascii letterst string.digitst string.punctuation 
>>> = .join([random.choice (x) for i in range(1000)]) 
>>> fram collections import defaultdict 
>>> frequences= defaultdict (int) # 所 有 值 默认 为 0 
>>> frequenoes 
Gefaultdict (< class 'int"> ,{}) 
>>> for item in z: 
frequenoes[item]+=1 # 修 改 每 个 字符 的 频次 
>>> frequenoes.items () 


3. Counter 类 


对 于 频次 统计 的 问题 ,使 用 collections 模块 的 Counter 类 可 以 更 加 快速 地 实现 这 个 
功能 ,并 且 能 够 提供 更 多 的 功能 ,如 查找 出 现 次 数 最 多 的 元 素 。 


>>> fram collections import Counter 


>>> frequences= Counter (z) # 这 里 的 = 还 是 前 面 代码 中 的 字符 串 对 象 
>>> fregquences.items () 

>>> frequences.most_commpn (1) # 返 回 出 现 次 数 最 多 的 一 个 字符 及 其 频率 
>>> frequences.most_commpn (3) # 返 回 出 现 次 数 最 多 的 前 3 个 字符 及 其 频率 


3.4 集合 : 元 素 之 间 不 允许 重复 


集合 (set) 属 于 Python 无 序 可 变 序列 ,使 用 一 对 大 括号 作为 定 界 符 , 元 素 之 间 使 用 去 
号 分 隔 ,同一 个 集合 内 的 每 个 元 素 都 是 唯一 的 ,元 素 之 间 不 允许 重复 。 

集合 中 只 能 包含 数字 .字符 串 、 元 组 等 不 可 变 类 型 (或 者 说 可 哈 希 ) 的 数据 ,而 不 能 包 
含 列表 字典、 集合 等 可 变 类 型 的 数据 。 Python 提供 了 一 个 内 置 机 数 hash() 来 计算 对 象 
的 哈 希 值 ,凡是 无 法 计算 哈 希 值 (调用 内 力 函 数 hash() 时 抛 出 异常 ) 的 对 象 都 不 能 作为 集 
合 的 元 素 ,也 不 能 作为 字典 对 象 的 “ 键 ”。 


341 集合 对 象 的 创建 与 删除 
直接 将 集合 赋值 给 变量 即 可 创建 一 个 集合 对 象 。 
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>>> 王 13,5) # 创 建 集合 对 象 
>>> type (a) # 查 看 对 象 的 类 型 


<class 'set'> 

也 可 以 使 用 set() 函数 将 列表 元 组 ,字符 串 、range 对 象 等 其 他 可 迭代 对 象 转换 为 集 
合 , 如 果 原 来 的 数据 中 存在 重复 元 素 , 则 在 转换 为 集合 的 时 候 只 保留 一 个 ;如 果 原 序列 或 
迭代 对 象 中 有 不 可 哈 希 的 值 ,无 法 转换 成 为 集合 , 抛 出 异常 。 


>>>a_set= set (range (8,14)) # 把 range 对象 转换 为 集合 
>>>a set 

{8,9,10,11,12,13} 

>>>b set= set([0,1,2,3,0,1,2,3,7,8]) # 转 换 时 自动 去 掉 重 复元 素 
>>>b set 

{0,1,2,3,7,8} 

>>> 交 set() # 空 集合 


除了 列表 推导 式 、 生 成 器 推导 式 .字典 推导 式 之 外 ,Python 还 支持 使 用 集合 推导 式 来 
快速 生成 集合 。 

>>> {x.strip() for x in ('he ','she ',' I')} 

I he he 

>>> import random 

>>> = {randcm.randint (1, 500) for i in range(100)} 

# 生 成 随机 数 ,自动 去 除 重复 元 素 

>>> len(x) # 一 般 而 言 输出 结果 会 小 于 100 

>>> {str (x) for x in range (10)} 

{3', 0, 11, 8, 14, 7, 5 16", '9', "21} 


当 不 再 使 用 茶 个 集合 时 ,可 以 使 用 del 命令 删除 整个 集合 。 
342 集合 操作 与 运算 
1. 增加 与 删除 集合 元 素 


集合 对 象 的 add() 方 法 可 以 增加 新 元 素 ,如 果 该 元 素 已 存在 则 忽略 该 操作 ,不 会 抛 出 
异常 ;update() 方 法 合并 另外 一 个 集合 中 的 元 素 到 当前 集合 中 ,并 自动 去 除 重复 元 素 。 


>>> = {1,2,3} 


>>> s.ada(3) # 增 加 元 素 ,重复 元 素 自动 忽略 

>>> s.update({3,4}) # 更 新 当前 字典 ,自动 忽略 重复 的 元 素 
>>> 3 

{1,2,3,4} 


集合 对 象 的 pop() 方 法 随机 删除 并 返回 集合 中 的 一 个 元 素 , 如 果 集合 为 空 则 抛 出 异 
常 ;remove() 方 法 删除 集合 中 的 元 素 ,如果 指 定 元 素 不 存在 则 抛 出 异常 ;discard() 方 法 从 
集合 中 删除 一 个 特定 元 素 ,如 果 元 素 不 在 集合 中 则 忽略 该 操作 ;clear() 方 法 清空 集合 。 
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>>> s.discard(5) # 删 除 元 素 ,不 存在 则 忽略 该 操作 
>>> s.remove (5) # 删 除 元 素 ,不 存在 就 抛 出 异常 
KeyError: 5 
>>> s.pop() # 删 除 并 返回 一 个 元 素 
间 
2. 集合 运算 


内 置 函 数 len() ,max() 、min() 、sum()、sorted()、map() ,filter()、enumerate() 等 也 
适用 于 集合 。 另 外 ,Python 集合 还 支持 数学 意义 上 的 交集 、 并 集 、 差 集 等 运算 。 


>>>a set= set ([8,9,10,11,12,13]) 
>>>b _set= {0,1,2,3,7,8} 


>>>a set | b set # 并 集 
{0,1,2,3,7,8,9,10,11,12,13} 

>>>a_set.union(b set) # 并 集 
{0,1,2,3,7,8,9,10,11,12,13} 

>>>a set &b set # 交 集 
{8} 

>>>a_set.intersection(b set) # 交 集 
{8} 

>>>a_set.differenoe (b set) # 差 集 
{9,10,11,12,13} 

>>>a_ set-b set 

{9,10,11,12,13} 

>>>a_set.symmetric difference (b set) # 对 称 差 集 


{0,1,2,3,7,9,10,11,12,13} 

>>>a set ^b set 

{0,1,2,3,7,9,10,11,12,13} 

>>>= {1,2,3} 

>>> {1,2,5} 

>>> = {1,2,3,4} 

>>>x<y # 比 较 集合 大 小 /包含 关系 
False 

>>>x<z # 真 子 集 

True 

>>>yz 

False 

>>> {1,2,3}<= {1,2,3} # 子 集 

True 

>>> x.issubset (y) # 测 试 是 否 为 子 集 
False 

>>> x.issubset (z) 

True 
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>>> {3} & {4} 

set() 

>>> {3}.isdisjoint ({4}) # 如 果 两 个 集合 的 交集 为 空 ,返回 True 
True 


需要 注意 的 是 ,关系 运算 符 二 、 二 二 一、 一 二 作用 于 集合 时 表示 集合 之 间 的 包含 关 


系 ,而 不 是 比较 集合 中 元 素 的 大 小 关系 。 对 于 两 个 集合 A 和 B, 如 果 A 二 B 不 成 立 ,不 代 
表 A 二 二 B 就 一 定 成 立 。 


343 集合 应 用 案例 


The Zen of Python 认为 There should be one 一 and preferably only one 一 obvious 


way to do it。 编 写 代 码 时 除了 要 准确 地 实现 功能 之 外 ,还 要 考虑 代码 的 优化 ,尽量 找到 
一 种 更 快 更 好 的 方法 实现 预定 功能 。Python 字典 和 集合 都 使 用 哈 希 表 来 存储 元 素 ,元 
素 查 找 速度 非常 快 ,关键 字 in 作用 于 字典 和 集合 时 比 作 用 于 列表 要 快 得 多 。 


jimport random 
jimport time 


x1= list (range (10000)) 

22= tuple (range (10000)) 

23= set (range (10000)) 

x4- dict (zip (range (1000) , range (10000))) 
I= random. randint (0, 9999) 


for t in (x4,x3,22,x1): 
Start= time.time() 
for i in range (9999999) : 
rint 
print (type (t), 'time used: ', time.time()- start) 


从 下 面 的 运行 结果 可 以 看 出 ,对 于 成 员 测 试 运算 符 in, 列 表 的 效率 远 远 不 如 字典 和 和 集 


合 , 并 且 随 着 序列 的 变 长 ,列表 的 查找 速度 越 来 越 慢 ,而 字典 和 集合 基本 上 不 受 影响 。 


<class 'dict'> time used: 1.1570661067962646 
< class 'set'> time used: 1.442082405090332 

< class 'tuple'> time used: 1185.4768052101135 
< class 'list'> time used: 1183.18967461586 


作为 集合 的 具体 应 用 ,可 以 使 用 集合 快速 提取 序列 中 的 单一 元 素 , 即 提取 出 序列 中 所 


有 不 重复 的 元 素 。 如 果 使 用 传统 方式 ,需要 编写 下 面 的 代码 : 


>>> import randcm 

# 生 成 100 个 介 于 o~ 9999 之 间 的 随机 数 

>>> listRandomr [random.choice (range (10000)) for i in range(100)] 
>>> noRepeat= [] 


® 
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>>> for i in listRandom : 
if i not in noRepeat : 
naRepeat .append (i) 
而 如 果 使 用 集合 ,只 需 下 面 这 么 一 行 代码 就 可 以 了 。 
>>> newSet= set (ListRandom) 


集合 中 的 元 素 不 允许 重复 ,Python 集合 的 内 部 实现 为 此 做 了 大 量 相应 的 优化 ,添加 
元 素 时 如 果 已 经 存在 重复 元 素 则 自动 忽略 。 下 面 的 代码 用 于 返回 指定 范围 内 一 定数 量 的 
不 重复 数字 。 


jimport randcm 


Gef randcmNurbers (numibber, startveng) : 
"使 用 集合 来 生成 mmber 个 介 于 start 和 end 之 间 的 不 重复 随机 数 '"' 
data= set() 
while len(data)<numiber: 
element= randcom.ranciint (start,end) 
data.add(element) 
retum data 


当然 ,如 果 在 项 目 中 需要 这 样 一 个 功能 ,还 是 直接 使 用 random 模块 的 sample() 函 数 更 
好 一 些 。 但 random 模块 的 sample() 函 数 只 支持 列表 ,元 组 ,集合 、 字 符 串 和 range 对 象 ， 
不 支持 字典 以 及 map、zip、enumerate,filter 等 惰性 求 值 的 迭代 对 象 。 

>>> import random 

>>> randomsanple (range (1000) , 20) # 在 指定 分 布 中 选取 不 重复 的 元 素 

[61, 538, 873, 815, 708, 609, 995, 64, 7, 719, 922, 859, 807, 464, 789, 651, 31, 702, 504, 25] 

下 面 的 两 段 代 码 用 来 测试 指定 列表 中 是 否 包含 非法 数据 ,很 明显 第 二 段 使 用 集合 的 
代码 更 高 效 一 些 。 

jimport random 

lstColor= ('red', 'green', 'blue') 


Colors= [randcm.choice (lstColor) for i in range (10000)] 


for item in colors: # 遍 历 列表 中 的 元 素 并 逐个 判断 
if item not in lstcolor: 
Erint ('error: ', item) 
break 


if (set(colors)- set (1stColor)): # 转 换 为 集合 之 后 再 比较 


print (‘error') 


假设 已 有 若干 用 户 名 字 及 其 喜欢 的 电影 清单 , 现 有 某 用 户 , 已 看 过 并 喜欢 一 些 电影 ， 
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现在 想 找 个 新 电影 看 看 ,又 不 知道 看 什么 好 。 根 据 已 有 数据 ,查找 与 该 用 户 爱好 最 相似 的 
用 户 , 也 就 是 看 过 并 喜欢 的 电影 与 该 用 户 最 接近 的 用 户 ,然后 从 那个 用 户 喜 欢 的 电影 中 选 
取 一 个 当前 用 户 还 没 看 过 的 电影 ,然后 推荐 。 


fram randem jmport randrange 


# 其 他 用 户 喜欢 看 的 电影 清单 
data = {ruser'+ str(i) :{"film'+ str (randrange (1, 10))\ 
for j in range (randrange (15)) 
for i in range (10)} 


# 待 测 用 户 曾经 看 过 并 感觉 不 错 的 电影 
user ={"filml', 'film2', "film3'} 
# 查 找 与 待 测 用 户 最 相似 的 用 户 和 他 喜欢 看 的 电影 
similarUser, films =max (data.items(),\ 
key= larbda item: len (item[1]&user)) 

Erint(" 历 史 数据 : ) 
for u, f in data.items() : 

Print(u, f, see= "':') 
print('" 和 您 最 相似 的 用 户 是 : '，similarUser) 
Erint(" 他 最 喜欢 看 的 电影 是 : "，films) 
Print(" 他 看 过 的 电影 中 您 还 没 看 过 的 有 : '，films- user) 


某 次 运行 结果 如 图 3-3 所 示 。 


历史 数据 : 
user0: {" film9', ‘film3’, film6’, film?’, ‘film5’, 'filml’} 
userl: {' filml’ 


user2: {' film?7’, ‘film9', ‘film6’, 'film2', ‘film3', 'film4'} 

user3: {film3’, ‘film5’, ‘film9’, ' film4’}) 

userd: {"film8'， ‘Film3’, ‘film6’, film2’, ‘film7’, ‘filml’, “film4'} 
user5: {' film2’, film3', ‘film8’, ‘film4') 


user6: {' film8', ‘film9’, ‘film6’, film3'， ‘filml’, ‘film5"} 


"film3'， ‘film6', "film7'， ‘filml’, ‘film4’} 
Oy filmg’, film6’, ’ film2’, “film3' ‘filml’, 'film4'} 


以 的 用 
入 各 矢 开 的 电影 是 : {film8’，' film3’, 'film6’, “film2'， “film7 “filml ， ‘film4’ 
他 春 过 的 电影 中 您 还 没 看 过 的 有 :” {"film7'，"film8”， "film6;，*film4] 


3-3 ”电影 推荐 代码 运行 结果 


3.5 序列 解 包 的 多 种 形式 和 用 法 


序列 解 包 (Sequence Unpacking) 是 Python 中 非常 重要 和 常用 的 一 个 功能 ,可 以 使 用 
非常 简洁 的 形式 完成 复杂 的 功能 ,提高 了 代码 的 可 读 性 ,减少 了 程序 员 的 代码 输入 量 。 
>>>%y, = 1,2,3 # 多 个 变量 同时 赋值 


>>>v tuple= (False,3.5, 'exp') 
>>> (x,y,2)=v tuple 
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>>>xy,=v tuple 
>>>%,y, = range (3) # 可 以 对 range 对 象 进行 序列 解 包 
>>> wy, = iter([1,2,3]) # 使 用 选 代 器 对 象 进行 序列 解 包 
>>> x,y, map (str, range (3)) # 使 用 可 迭代 的 map 对 象 进行 序列 解 包 
>>>a,b=b,a 考 交换 两 个 变量 的 值 


序列 解 包 还 可 以 用 于 列表 .字典 ,enumerate 对 象 .filter 对 象 ,zip 对 象 等 。 对 字典 使 
用 时 ,默认 是 对 字典 * 键 ”进行 操作 ,如 果 对 “ 键 : 值 ” 对 进行 操作 应 使 用 字典 的 items() 方 法 
说 明 , 如 果 需 要 对 字典 “ 值 ” 进 行 操作 应 使 用 字典 的 values() 方 法 明确 指定 。 


>>> a [1,2,3] 


>>>b,c,d-a # 列 表 也 支持 序列 解 包 的 用 法 

>>> x,y, = sorted([1,3,2]) # sorted() 函 数 返 回 排序 后 的 列表 

>>> = {'a':l, b':2, 'c':3} 

>>>b,c,d= s.items() # 这 里 的 重点 是 序列 解 包 的 用 法 

>>>b 

('c',3) 

>>>b,c,d-s # 使 用 字典 时 不 用 太 多 考虑 元 素 的 顺序 

>>>b # 在 Python 3.6.x 和 更 新 版 本 中 略 有 不 同 是 正常 的 


Wn 
>>>b,c,d s.values() 

>>> Print (b,c,d) 

132 

>>> ab,o= 'ABC' # 字 符 串 也 支持 序列 解 包 
>>>print (a,b,c) 

ABC 


使 用 序列 解 包 可 以 很 方便 地 同时 遍历 多 个 序列 。 


>>> keys= ['a', 'b', 'c', 'd'] 
>>> values= [1,2,3,4] 
>>> for k,v in zip (keys,values) : 
Print ((k,v) ,end= ' ') 
('a',l) (b',2) ('c',3) ('d',4) 
>>> 有 = ['a','b','c'] 
>>> for i,v in enumerate (x) : 
Print ("The value on position {0} is {1}"'.fommat (i,v)) 
The value cn Position 0 is a 
The value cn Position 1 is b 
The value on position 2 is c 
>>> == {'a':l, 'b':2, 'c':3} 
>>> for kv in s.items(): # 字 典 中 的 每 个 元 素 包含 “ 键 " 和 “ 值 ” 两 部 分 
Print ((k,v) ,end= " ') 
(ar (b',2) ('c',3) 


下 面 的 代码 演示 了 序列 解 包 的 男 类 用 法 和 错误 的 用 法 : 
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>>>print 人 [1,2,3],4,* (5,6)) 

123456 

>>>*range (4) ,4 

(0,1,2,3,4) 

>>>*range (4) # 不 允许 这 样 用 
SyntaxError: can't use starred expression here 

>>> {* range (4) ,4,* (5,6,7)} 

{0,1,2,3,4,5,6,7} 

> Ly 2 

Us 

>>> arbyc= range (3) 

>>> arbyc=#range (3) # 不 允许 这 样 用 
SyntaxError: can't use starred expression here 
>>>ab,c,d=*range (3),3 


下 面 的 代码 看 起 来 与 序列 解 包 类 似 , 但 严格 来 说 是 序列 解 包 的 逆 运 算 ,与 函数 的 可 变 
长 度 参数 一 样 ( 详 见 5. 2. 4 节 ), 用 来 收集 等 号 右 侧 的 多 个 数值 。 


>>>axb,c=1,2,3,4,5 

>>>ab,c 

(1, [2,3,4],5) 

>>>b 

[2,3,4] 

>>>ax*b,c=1,2,3,4 

>>> arbyc 

(1, [2,3],4) 

>>> axbyc= tuple (range (20)) 

>>>b 

[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18] 

>>>*#b=1,2,3,4 # 等 号 左 侧 必须 为 列表 、 元 组 或 多 个 变量 
SyntaxError: starred assignment target must be in a list or tuple 


本 章 小 结 


(1) 列表 是 包含 若干 元 素 的 有 序 连续 内 存 空 间 , 当 增 加 和 删除 元 素 时 ,列表 对 象 自动 
进行 内 存 的 扩展 和 收缩 ,保证 相 邻 元 素 之 间 没 有 缝隙 。 

(2) 应 尽量 从 列表 尾部 进行 元 素 的 追加 与 删除 操作 。 

(3) 列表 、 元 组 和 字符 串 支 持 双向 索引 ,字典 支持 使 用 * 键 ”作为 下 标 访问 其 中 的 元 素 
值 , 集 合 不 支持 任何 索引 。 

(4) 切片 操作 作用 于 列表 时 具有 最 强大 的 功能 。 

(5) 列表 是 可 变 的 ,元 组 是 不 可 变 的 ,这 是 一 个 非常 本 质 的 区 别 。 

(6) 列表 推导 式 得 到 的 是 列表 ,而 生成 器 推导 式 得 到 的 是 生成 器 对 象 。 

(7) 字典 的 * 键 ?和 集合 的 元 素 都 不 允许 重复 ,并 且 必 须 是 不 可 变 的 数据 类 型 。 
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(8) 关键 字 in 可 以 用 于 列表 以 及 其 他 可 迭代 对 象 ,包括 元 组 .字典 、range 对 象 . 字 符 
串 、 集 合 等 ,常用 在 循环 语句 中 对 序列 或 其 他 可 迁 代 对 象 中 的 元 素 进行 遍历 。 


习 题 


3.1 为 什么 户 ee dhl 

3.2 Python 3. x 的 range() 函 数 返回 一 

3.3 编写 程序 ,生成 包含 0 之 间 的 随机 整数 ， 并 统计 每 个 元 素 的 出 现 
次 数 。 

3.4 表达 式 “[3] in [1, 2, 3, 4]” 的 值 为 四 

3.5 编写 程序 ,用 户 输入 一 个 列表 和 两 个 整数 作为 下 标 , 然 后 使 用 切片 获取 并 输出 
列表 中 介 于 两 个 下 标 之 间 的 元 素 组 成 的 子 列表 。 例 如 ,用 户 输入 [1,2,3,4,5,6] 和 2、5， 
程序 输出 [3,4,5,6]。 

3.6 列表 对 象 的 sort() 方 法 用 来 对 列表 元 素 进 行 原 地 排序 ,该 函数 的 返回 值 





为 





3.7 列表 对 象 的 方法 删除 首次 出 现 的 指定 元 素 , 如 果 列 表 中 不 存在 要 删除 
的 元 素 , 则 抛 出 异常 。 

3.8 假设 列表 对 象 aList 的 值 为 [3, 4, 5, 6, 7, 9, 11, 13, 15, 17] ,那么 切片 aList 
[3:7] 得 到 的 值 是 

3.9 设计 一 个 字典 ,并 编写 程序 ,用 户 输入 内 容 作为 “ 键 ” 然 后 输出 字典 中 对 应 的 
“ 值 ”, 如 果 用 户 输 入 的 “ 键 " 不 存在 , 则 输出 “您 输入 的 键 不 存在 1”。 

3.10 编写 程序 ,生成 包含 20 个 随机 数 的 列表 ,然后 将 前 10 个 元 素 升序 排列 ,后 10 
个 元 素 降序 排列 ,并 输出 结果 

3.11 在 Python 中 ,字典 和 集合 都 是 用 一 对 作为 界定 符 , 字 典 的 每 个 元 素 
由 两 部 分 组 成 , 即 和 ,其 中 不 允许 重复 。 

3.12 使 用 字典 对 象 的 方法 可 以 返回 字典 的 “ 键 : 值 ” 对 ,使 用 字典 对 象 的 

方法 可 以 返回 字典 的 “ 键 ”", 使 用 字典 对 象 的 方法 可 以 返回 字典 的 “ 值 ”。 

3.13 ”假设 有 列表 a 二 [name','age','sex ] 和 bb 二 ['Dong',38,'"Male"], 请 使 用 一 个 语句 
将 这 两 个 列表 的 内 容 转换 为 字典 ,并 且 以 列表 a 中 的 元 素 为 “ 键 ”, 以 列表 b 中 的 元 素 为 
“ 值 ”, 这 个 语句 可 以 写 为 

3.14 假设 有 一 个 列表 a， 现 要 求 从 列表 a 中 每 3 个 元 素 取 1 个 ,并 且 将 取 到 的 元 素 
组 成 新 的 列表 b, 可 以 使 用 语句 
3.15 使 用 列表 推导 式 生成 包含 10 个 数字 5 的 列表 ,语句 可 以 写 为 
3.16 (可 以 \ 不 可 以 ) 使 用 del 命令 来 删除 元 组 中 的 部 分 元 素 。 
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有 了 合适 的 数据 类 型 和 数据 结构 之 后 ,还 要 依赖 于 选择 和 循环 结构 来 实现 特定 的 业 
务 逻辑 。 一 个 完整 的 选择 结构 或 循环 结构 可 以 看 作 是 一 个 大 的 “语句 ”, 从 这 个 角度 来 讲 ， 
程序 中 的 多 条 “语句 ”是 顺序 执行 的 。 


4.1 条 件 表达 式 


在 选择 结构 和 循环 结构 中 ,都 要 根据 条 件 表达 式 的 值 来 确定 下 一 步 的 执行 流程 。 条 件 
表达 式 的 值 只 要 不 是 False、0( 或 0.0.0j 等 )、 空 值 None、 空 列表 、 空 元 组 \ 空 集合 \、 空 字典 \ 空 
字符 串 \ 空 range 对 象 或 其 他 空 迭 代 对 象 ,Python 解释 器 均 认为 与 True 等 价 。 从 这 个 意义 
上 来 讲 ,所 有 的 Python 合法 表达 式 都 可 以 作为 条 件 表达 式 ,包括 含有 函数 调用 的 表达 式 。 

关于 表达 式 和 运算 符 的 详细 内 容 请 参考 2. 2 节 , 这 里 再 重点 介绍 一 下 几 个 比较 特殊 
的 运算 符 。 


1. 关系 运算 符 


Python 中 的 关系 运算 符 可 以 连续 使 用 ,这 样 不 仅 可 以 减少 代码 量 ,也 比较 符合 人 类 
的 思维 方式 。 

>>> print (1< 2< 3) # 等 价 于 1<2 and 2<3 

True 

>>>print (1< 2> 3) 

False 

>>>print (1< 3> 2) 

True 


在 Python 语法 中 ,条 件 表达 式 中 不 允许 使 用 赋值 运算 符 “=”, 避 免 了 误 将 关系 运算 
符 “ 二 二 ”写成 赋值 运算 符 “ 二 ” 带 来 的 麻烦 。 在 条 件 表达 式 中 使 用 赋值 运算 符 “ 二 ”将 抛 出 
异常 ,提示 语法 错误 。 

>>> if 3: # 条 件 表达 式 中 不 允许 使 用 赋值 运算 符 

SyntaxError: invalid syntax 

>>>if (=3) and =)): 

SyntaxError: invalid syntax 
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属 
关系 运算 符 具 有 惰性 计算 的 特点 ,只 计算 必须 计算 的 值 ,而 不 是 计算 关系 表达 式 中 的 
每 个 表达 式 。 
>>D 2 xr # 当 前 上 下 文中 并 不 存在 变量 xzex 
False 
2. 逻辑 运算 符 


逻辑 运算 符 and、or、not 分 别 表示 与 .或 , 非 3 种 迎 辑 运算 ,在 功能 上 可 以 与 电路 的 连 
接 方式 做 个 简单 类 比 : or 运算 符 类 似 于 并 联 电路 ,只 要 有 一 个 开关 是 通 的 那么 灯 就 是 亮 
的 ;and 运算 符 类 似 于 串联 电路 ,必须 所 有 开关 都 是 通 的 灯 才 会 亮 ;not 运算 符 类 似 于 短路 
电路 ,如 果 开 关 通 了 那么 灯 就 灭 了 ,如 图 4-1 所 示 。 


a 
Kl K2 K 

















Kl K2 



































(a) or, 类 似 于 并 联 电路 (b) and, 类 似 于 串联 电路 (c) not 类 似 于 短路 
图 4-1 逻辑 运算 符 与 几 种 电路 的 类 比 关系 


与 关系 运算 符 类 似 ,逻辑 运算 符 and 和 or 具有 短路 求 值 或 情 性 求 值 的 特点 ,可 能 不 
会 对 所 有 表达 式 进行 求 值 ,而 是 只 计算 必须 计算 的 表达 式 的 值 。 以 and 为 例 ,对 于 表达 式 
“表达 式 1 and 表达 式 2” 而 言 ,如 果 “ 表 达 式 1” 的 值 为 False 或 其 他 等 价值 时 ,不 论 “ 表 达 
式 2” 的 值 是 什么 ,整个 表达 式 的 值 都 是 False, 丝毫 不 受 “ 表 达 式 2” 的 影响 ,因此 “表达 式 
2” 不 会 被 计算 。 在 设计 包含 多 个 条 件 的 条 件 表达 式 时 .如 果 能 够 大 概 预测 不 同 条 件 失败 
的 概率 ,并 将 多 个 条 件 根 据 and 和 or 运算 符 的 短路 求 值 特 性 来 组 织 顺序 ,可 以 提高 程序 
运行 效率 。 

>>>3and 5 


§ 


>>>3or 5 
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下 面 的 函数 使 用 指定 的 分 隔 符 把 多 个 字符 串 连接 成 一 个 字符 串 , 如 果 用 户 没 有 指定 
分 隔 符 则 使 用 逗号 。 

>>> def Join (dhList, sep= None) : 

retum (sep or ',') .join(christ) # 注 意 : 参数 ssp 不 是 字符 串 时 会 抛 出 异常 

>>> hiTest= ['1"','2"','3', "4"','5°] 

>>> Join (chTest) 

| 

>>> Join (chTest, ':') 

二 4 


当然 ,也 可 以 把 上 面 的 函数 直接 定义 为 下 面 带 有 默认 值 参 数 的 形式 : 


>>> def Join (chList, sep= ', "): 
retum sep.join (chList) 


4.2 选择 结构 


常见 的 选择 结构 有 单 分 支 选 择 结构 、 双 分 支 选 择 结构 、 多 分 支 选择 结构 及 嵌 套 的 分 支 
结构 ,也 可 以 构造 跳 转 表 来 实现 类 似 的 迎 辑 。 另 外 ,循环 结构 和 异常 处 理 结构 中 也 可 以 带 
有 else 子 句 ,可 以 看 作 特 殊 形式 的 选择 结构 ,参考 4. 3 节 和 11. 1 节 的 介绍 。 


421 单 分 支 选 择 结构 


单 分 支 选择 结构 语法 如 下 所 示 ,其 中 表达 式 后 面 的 冒号 :是 不 可 缺少 的 ,表示 一 个 
语句 块 的 开始 ,并 且 语 句 块 必须 做 相应 的 缩 进 ,一 般 是 以 4 个 空格 为 缩 进 单位 。 
if 表 达 式 : 
语句 块 
当 表达 式 的 值 为 True 或 其 他 与 True 等 价 的 值 时 ,表示 条 件 满足 ,语句 块 被 执行 , 否 
则 该 语句 块 不 被 执行 ,而 是 继续 执行 后 面 的 代码 (如 果 有 ) ,如 图 4-2 所 示 。 
下 面 的 代码 演示 了 单 分 支 选 择 结构 的 用 法 : 
= input ("Input two nunbers:') 
ab=mep(int,x.split ()) 
if a>b: 
ab=b,a # 序 列 解 包 ,交换 两 个 变量 的 值 
Print arb) 
在 Python 中 ,代码 的 缩 进 非常 重要 , 缩 进 是 体现 代码 逻辑 关系 的 重要 方式 ,同一 个 
代码 块 必须 保证 相同 的 缩 进 量 。 在 实际 开发 中 ,只 要 遵循 一 定 的 约定 ,Python 代码 的 排 
版 是 可 以 降低 要 求 的 。 例 如 下 面 的 代码 ,虽然 不 建议 这 样 写 ,但 确实 是 可 以 执行 的 。 


>>> if 3 2: print ('ok') # 如 果 语 句 较 短 ,可 以 直接 写 在 分 支 语句 后 面 
ok 
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>>> if True:print (3) ;print (5) # 在 一 行 写 多 个 语句 ,使 用 分 号 分 隔 
5 


422 双 分 支 选 择 结构 
双 分 支 选择 结构 的 语法 为 


if 表达 式 : 
语句 块 1 
else: 
语句 块 2 
当 表达 式 的 值 为 True 或 其 他 等 价值 时 ,执行 语句 块 1, 否 则 执行 语句 块 2。 语 句 块 1 
或 语句 块 2 总 有 一 个 会 执行 ,然后 执行 后 面 的 代码 (如 果 有 ) ,如 图 4-3 所 示 。 


条 件 表达 式 是 否 成 立 ? 
是 


否 


| | 


图 4-2 单 分 支 选 择 结构 图 4-3 双 分 支 选 择 结构 



































下 面 的 代码 通过 鸡 兔 同 笼 问题 演示 了 双 分 支 结 构 的 用 法 。 
jiturtui=map (int,input(" 请 输入 鸡 锡 总数 和 腿 总 数 : ') .split0) 
te (tui - jitax 2)/2 
if int (tu)==tu: 
print(' 鸡 : {0}, 兔 : {1}'.fommat (int Gitu tu),int (tu))) 
else: 
print (数据 不 正确 ,无 解 ) 
另外 ,Python 还 提供 了 一 个 三 元 运算 符 , 并 且 在 三 元 运算 符 构 成 的 表达 式 中 还 可 以 
嵌 套 三 元 运算 符 , 可 以 实现 与 选择 结构 相似 的 效果 。 语 法 为 
valuel if oondition else value2 
当 条 件 表 达 式 condition 的 值 与 True 等 价 时 ,表达 式 的 值 为 valuel ,否则 表达 式 的 值 
为 value2。 另 外 ,valuel 和 value2 本 身 也 可 以 是 复杂 表达 式 ,也 可 以 包含 函数 调用 ,甚至 
可 以 是 三 元 运算 符 构 成 的 表达 式 。 这 个 结构 的 表达 式 也 具有 惰性 求 值 的 特点 。 
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>>> 二 5 
>>> print (6) if a> 3 else print (5) 
6 


>>>print (6 if a> 3 else 5) # 虽 然 结果 与 上 一 行 代码 一 样 ,但 代码 含义 不 同 
6 
>>>b6ifa>l3else9 # 赋 值 运算 符 的 优先 级 非常 低 
>>>b 
9 
>>> math.scpt (9) if 5> 3 else random.randint (1,100) # 还 没有 导入 math 模 块 
NemsFrror: name "math' is not defined 
>>> import math 
>>> = math.sqpt (9) if 5> 3 else random.randint (1,100) # 还 没有 导入 random 模 块 
# 但 表达 式 5> 3 的 值 为 True 
# 所 以 可 以 正常 运行 
>>> =math.sqt (9) if 2> 3 else randomrandint (1,100) # 条 件 表达 式 2>3 的 值 为 False 


# 需 要 计算 第 二 个 表达 式 
# 但 此 时 还 没 导 入 randcm 
# 所 以 出 错 

NameError: name "Tandcom' is not defined 

>>> import randcm # 导 和 randcm 成 功 执行 

>>> =math.sqrt (9) if 2 3 else randcm.randint(1,100) 


虽然 三 元 运算 符 可 以 嵌 套 使 用 ,可 以 实现 复杂 的 多 分 支 选 择 结构 的 效果 ,但 这 样 的 代 
码 可 读 性 非常 差 ,不 建议 使 用 。 


>>> 王 3 

>>> if ww 2 else 0) if f(x)>5 else ('a' 和 fxk5else 'b') # 可 以 嵌 套 使 用 ,不 建议 这 样 写 
1 

>>> 三 0 

>>> (1 if x> 2 else 0) if f(x)>5 else ('a' if x< 5 else 'b') 


i 


423 多 分 支 选择 结构 
多 分 支 选 择 结构 的 语法 为 


迁 表 达 式 1: 
语句 块 1 

elif 表达 式 2: 
语句 块 2 

elif 表达 式 3: 
语句 块 3 
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语句 块 n 


其 中 ,关键 字 elif 是 else if 的 缩写 。 下 面 的 代码 演示 了 如 何 利用 多 分 支 选择 结构 将 成 绩 
从 百分制 变换 到 等 级 制 。 


def func(score) : 
if score> 100 or score< 0: 
retum "wrong score.must between 0 and 100." 
elif score >= 90: 
retum 'A' 
elif score >= 80: 
retum 'B' 
elif score >=70: 
retum 'C' 
elif score >=60: 
retum 'D' 
else: 
retum 'E' 


424 选择 结构 的 崔 套 
选择 结构 可 以 通过 嵌 套 来 实现 复杂 的 业务 逻辑 ,语法 如 下 : 





if 表 达 式 1: 
语句 块 1 
表达 式 2: if 表达 式 1: 
语句 块 2 语句 块 1 
else: 表达 式 2: 
语句 块 3 1 | a sm 
else: 
i 表达 式 4: 引 语 和 块 3 
本 else: 
语句 块 4 生 表达 式 4: 
上 面 语法 示意 中 的 代码 层次 和 隶属 关系 如 图 4.4 所 下文 4 
示 , 注 意 相同 层次 的 代码 必须 具有 相同 的 缩 进 量 。 4 的 层 砍 写 当 网 大 委 


使 用 嵌 套 选择 结构 时 .一定 要 严格 控制 好 不 同 级 别 代码 块 的 缩 进 量 ,因为 这 决定 了 不 
同 代码 块 的 从 属 关系 和 业务 逻辑 是 否 被 正确 地 实现 ,以 及 代码 是 否 能 够 被 解释 器 正确 理 
解 和 执行 。 例 如 ,前 面 百分制 转 等 级 制 的 代码 ,作为 一 种 编程 技巧 ,还 可 以 尝试 下 面 的 
写法 : 
def func (score) : 
degree= 'DCBRRE 
if scorey 100 or score< 0: 
retum "wrong.score mst between 0 and 100." 
else: 
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index= (score - 60) // 10 
if index >=0: 

Teturn degree[index] 
else: 

Ieturn degree[- 1] 


4.3 循环 结构 


431 for 循环 与 while 循环 


Python 主要 有 for 循环 和 while 循环 两 种 形式 的 循环 结构 ,多 个 循环 可 以 符 套 使 用 ， 
并 且 还 经 常 和 选择 结构 嵌 套 使 用 来 实现 复杂 的 业务 逻辑 。while 循环 一 般 用 于 循环 次 数 
难以 提前 确定 的 情况 ,当然 也 可 以 用 于 循环 次 数 确定 的 情况 ;for 循环 一 般 用 于 循环 次 数 
可 以 提前 确定 的 情况 ,尤其 适用 于 枚 举 或 遍历 序列 或 迭代 对 象 中 元 素 的 场合 。 对 于 带 有 
else 子 句 的 循环 结构 ,如 果 循 环 因为 条 件 表 达 式 不 成 立 或 序列 遍历 结束 而 自然 结束 时 则 
执行 else 结构 中 的 语句 ,如 果 循 环 是 因为 执行 了 break 语句 而 导致 循环 提前 结束 则 不 会 
执行 else 中 的 语句 。 两 种 循环 结构 的 完整 语法 形式 分 别 为 
bile 条 件 表达 式 : 
循环 体 
[else: 
else 子 句 代码 块 ] 


for 取 值 ih 序列 或 迭代 对 象 : 
循环 体 

[else: 
else 子 句 代 码 块 ] 


其 中 , 方 括号 内 的 else 子 句 可 以 没有 ,也 可 以 有 。 下 面 的 代码 使 用 循环 结构 遍历 并 输出 
列表 中 的 所 有 元 素 。 


a list= ['a', 'b', mpilgrim' 'z"', 'exanple'] 
for ivv in enumerate (a list): 
print ("列表 的 第 ',it1,' 个 元 素 是 : ',v) 


下 面 的 代码 用 来 输出 1 一 100 之 间 能 被 7 整除 但 不 能 同时 被 5 整除 的 所 有 整数 。 


for i in range(1,101): 
寺 齐 大 =0 and 话 5=-0: 
Erint (i) 
下 面 的 代码 使 用 嵌 套 的 循环 结构 打印 九 九 乘法 表 。 


for i in range(1,10): 
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for j in range (l,i+ 1): 
print ("{0}* {1}= {2}".fommat (i,j,i* jjvend ') 
print () # 打 印 空 行 
下 面 的 代码 演示 了 带 有 else 子 句 的 循环 结构 ,该 代码 用 来 计算 1 十 2 十 3 十 … 十 99 十 
100 的 结果 。 
=0 
for i in range(1,101): 考 不 包括 101 
st=i 
else: 
Print (s) 
下 面 的 代码 使 用 while 循环 实现 了 同样 的 功能 : 
宇 二 0 
while i<=100: 
st=i 
计 =1 
else: 
Print (s) 
当然 ,上 面 的 两 段 代码 只 是 为 了 演示 循环 结构 的 用 法 ,其 中 的 else 子 句 实际 上 并 没 
有 必要 ,循环 结束 后 直接 输出 结果 就 可 以 了 。 另 外 ,如 果 只 是 计算 1 十 2 十 3 十 … 十 99 十 
100 的 值 ,直接 用 内 置 函数 sum() 和 range() 就 可 以 了 。 
>>> sum(range (1,101)) 
5050 


432 break 与 continue 语 名 


break 与 continue 语句 在 while 循环 和 for 循环 中 都 可 以 使 用 ,并 且 一 般 常 与 选择 结 
构 或 异常 处 理 结构 结合 使 用 。 一 旦 break 语句 被 执行 ,将 使 得 break 语句 所 属 层次 的 循 
环 提前 结束 ;continue 语句 的 作用 是 提前 结束 本 次 循环 ,忽略 continue 之 后 的 所 有 语句 ， 
提前 进入 下 一 次 循环 。 

下 面 的 代码 用 来 计算 小 于 100 的 最 大 素数 ,内 循环 用 来 测试 特定 的 整数 n 是 否 为 
素数 ,如 果 其 中 的 break 语句 得 到 执行 则 说 明 n 不 是 素数 ,并 且 由 于 循环 提前 结束 而 不 
会 执行 后 面 的 else 子 句 。 如 果 某 个 整数 n 为 素数, 则 内 循环 中 的 break 语句 不 会 执行 ， 
内 循环 自然 结束 后 执行 后 面 else 子 句 中 的 语句 ,输出 素数 n 之 后 执行 break 语句 跳出 
外 循环 。 


for n in range (100,1,—1): 
f=0: 
continue 
for i in range (3, int (me*0.5)+ 1,2) : 
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Print (n) 
# 结 束 外 循环 
break 


需要 注意 的 是 ,过 多 的 break 和 continue 语句 会 降低 程序 的 可 读 性 。 所 以 ,除非 
break 或 continue 语句 可 以 让 代码 更 简单 或 更 清晰 ,否则 不 要 轻易 使 用 。 


433 循环 代码 优化 技巧 


实际 开发 中 ,正确 实现 了 预定 功能 之 后 ,一般 还 需要 再 优化 一 下 代码 以 追求 更 高 的 执 
行 效率 。 如 果 能 从 算法 层面 上 进行 优化 , 那 毫 无 疑问 会 带 来 效率 的 大 幅度 提升 。 例 如 ， 
判断 一 个 大 整数 n 是 否 为 素数 ,如 果 根 据 素数 定义 去 判断 应 该 逐个 测试 [2,n 一 1] 区 间 上 
的 数 是 否 能 够 整除 n, 而 实际 上 只 需 判断 从 2 到 n 的 平方 根 这 个 小 范围 就 可 以 了 ,再 进 一 
步 说 ,实际 上 只 需 判断 2 以 及 3 到 n 的 平方 根 之 间 所 有 奇数 这 个 更 小 的 范围 。 对 于 大 整 
数 n 来 说 ,循环 次 数 和 余数 运算 的 次 数 减少 是 非常 可 观 的 ,n 越 大 算法 效率 的 提高 越 
显著 。 

在 编写 循环 语句 时 ,应 尽量 减少 循环 内 部 不 必要 或 无 关 的 计算 ,与 循环 变量 无 关 的 代 
码 应 该 尽 可 能 地 提取 到 循环 之 外 。 尤 其 是 多 重 循环 嵌 套 的 情况 ,一 定 要 尽量 减少 内 层 循 
环 中 不 必要 的 计算 , 尽 最 大 可 能 地 把 计算 向 外 提 。 例 如 下 面 的 代码 ,第 二 段 明 显 比 第 一 段 
的 运行 效率 要 高 。 


digits= (1,2,3,4) 


for i in range (1000): 
result= [] 
for i in digits: 
for j in digits: 
for k in digits: 
result .append (i* 100+ j*10+ kK) 


for i in range (1000): 
result= [] 
for i in digits: 
应 这 100 
for j in digits: 
地 六 10 
for k in digits: 
result.append(i+ 计 K) 


另外 ,在 循环 中 应 尽量 引用 局 部 变量 ,局 部 变量 的 查询 和 访问 速度 比 全 局 变量 略 快 。 
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同样 的 道理 ,在 使 用 模块 中 的 方法 时 ,可 以 通过 将 其 转换 为 局 部 变量 来 提高 运行 速度 。 例 
如 下 面 的 代码 ,第 二 段 代码 的 速度 就 比 第 一 段 代 码 略 快 。 当 然 , 也 可 以 使 用 from math 
import sin as loc_sin 来 代替 其 中 的 写法 。 


import math 


for i in range (10000000) : 


math.sin(i) 


loc sin=math.sin 
for i in range (10000000) : 
loc sin(i) 


代码 优化 涉及 的 内 容 非 常 广 泛 , 除 了 在 算法 层面 的 优化 之 外 ,编码 过 程 本 身 对 程序 员 

的 功底 要 求 也 非常 高 。 除 了 上 面 介绍 的 循环 代码 优化 ,本 书 其 他 章节 中 也 会 涉及 一 些 优 

化 的 内 容 。 例 如 ,如 果 经 常 需要 测试 一 个 序列 是 否 包含 一 个 元 素 就 应 该 尽量 使 用 字典 或 

集合 而 不 使 用 列表 ,把 多 个 字符 串 连接 成 一 个 字符 串 时 尽量 使 用 join() 方 法 而 不 要 使 用 

运算 符 十 ,对 列表 进行 元 素 的 插入 和 删除 操作 时 应 尽量 从 列表 尾部 进行 ,等 等 。 实 际 开发 

需要 注意 的 是 ,首先 要 把 代码 写 对 ,保证 完全 符合 功能 要 求 , 然 后 进行 必要 的 优化 来 提 
高 性 能 。 过 早 地 追求 性 能 优化 有 时 候 可 能 会 带 来 灾难 而 浪费 大 量 精力 。 


4.4 精彩 案例 赏析 


示例 4-1 输入 若干 个 成 绩 , 求 所 有 成 绩 的 平均 分 。 每 输入 一 个 成 绩 后 询问 是 否 继 
续 输 入 下 一 个 成 绩 , 回答 yes 就 继续 输入 下 一 个 成 绩 ,回答 no 就 停止 输入 成 绩 。 


numbers= [] # 使 用 列表 存放 临时 数据 
while True: 
= input(" 请 输入 一 个 成 绩 : ') 
try: # 异 常 处 理 结构 有 关 知 识 见 第 11 章 
nimbers.append (float (x)) 
except: 
print(' 不 是 合法 成 绩 ') 
while True: 
flag- input ("继续 输入 吗 ? (yes/no) ') 
if flag.lower() not in ('yes', ‘no'): # 限 定 用 户 输入 内 容 必须 为 ys 或 no 
print ("只 能 输入 yes 或 no') 
else: 
break 
if flag.lower()== "no': 
break 


Print (sum(numrbers) /len (ourbers)) 
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示例 4-2 ”编写 程序 ,判断 今天 是 今年 的 第 几 天 。 
import time 
aate= time.localtime() # 获 取 当 前 日 期 时 间 


YEarrmonthvday- date[:3] 
day month= [31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31] 


if years 400==0 or (Years 4==0 and year$® 100!= 0): # 判 断 是 否 为 头 年 
Say month[1]=29 

if month==1: 
Print (day) 

else: 


Print (sum(day month[:month- 1])+ day) 


Python 标准 库 datetime 提供 了 datetime 和 timedelta 对 象 可 以 很 方便 地 计算 指定 
年 、 月 \ 日 \ 时 ,分 \ 秒 之 前 或 之 后 的 日 期 时 间 , 还 提供 了 返回 结果 中 包含 “今天 是 今年 第 几 
天 ”今天 是 本 周 第 几 天 ”等 答案 的 timetuple() 函 数 ,等 等 。 


>>> import datetime 

>>> Today= datetime.date.today() 

>>> Today 

datetime.date (2016,10,8) 

>>> Today - datetime.date (Today.year, 1,1) + datetime.timedelta (days= 1) 
datetime.timedelta (282) 


>>> Today.timetuple() .tm yday # 今 天 是 今年 的 第 几 天 
282 

>>> Today.replace (year= 2013) # 蔡 换 日 期 中 的 年 
datetime.date (2013, 10, 8) 

>>> Today.replace month= 1) # 替 换 日 期 中 的 月 


datetime.date (2016, 1,8) 
>>> now= datetime.datetime.now() 
>>> DOW 
datetime.datetime (2016,10,8,15, 55, 16, 272174) 
>>> now.replace (second- 30) # 蔡 换 日 期 时 间 中 的 秒 
datetime.datetime (2016,10,8,15, 55, 30, 272174) 
>>> now + datetime.timedelta (days= 5) # 计 算 5 天 后 的 日 期 时 间 
datetime.datetime (2016,10,13, 15, 55,16, 272174) 
>>> now + datetime.timedelta (weeks=— 5) # 计 算 5 周 前 的 日 期 时 间 
datetime.datetime (2016, 9, 3, 15, 55, 16, 272174) 
>>> def daysBetween (yearl,monthl, dayl, year?,month?, day?2) : 
fram datetime import date # 计 算 两 个 日 期 之 间 相差 多 少 天 
dif= date (yearl,monthl, dayl) - date (year?,month?, day?) 
retum dif.days 


>>> daysBetween (2016, 12,11, 2016, 11, 27) 
14 
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>>> daysBetween (2016, 12,11,2011, 11, 27) 
1841 
另外 ,标准 库 calendar 也 提供 了 一 些 与 日 期 操作 有 关 的 方法 。 例 如 : 
>>> import calendar # 导 人 模块 
>>> print (calendar.calendar (2016)) # 查 看 2016 年 的 日 历 表 ,结果 略 
>>> print (calendar .month (2016, 11)) # 查 看 2016 年 11 月 份 的 日 历 表 
>>> calendar.isleap (2016) # 判 断 是 否 为 闽 年 
True 
>>> calendar .weekday (2016, 10, 26) # 查 看 指定 日 期 是 周 几 
2 
示例 4-3 编写 代码 ,输出 由 星 号 * 组 成 的 萎 形 图 案 , 并 且 可 以 灵活 控制 图 案 的 大 小 。 
Gef main (n) : 


for i in range (n): 

Print(('* '* i).oanter(n* 3)) 
for i in range(n,0,- 1): 

print(('* '* i).0oanter(n* 3)) 


图 4-5 和 图 4-6 分 别 为 参数 n= 二 6 和 n= 二 10 时 的 运行 效果 。 


人 闪 
ee 和 ,着 党 
让 半 二 更 二 -汪汪 刘 
(时 这 这 于 于 
本 二 
证 : 于 
季 者 兴 本 
LN 
四 * 
图 4-5 n 一 6 时 的 运行 效果 图 4-6 n 二 10 时 的 运行 效果 


示例 4-4 快速 判断 一 个 数 是 否 为 素数 。 


IF input ("TInput an integer:") 
IF int (n) 
if r=2: 

Print ('Yes') 
# 偶 数 必然 不 是 素数 
elif nr%2G==0: 

Print ('No') 
else: 
# 大 于 5 的 素数 必然 出 现在 6 的 倍数 两 侧 
# 因 为 Gxt 2、 Get 3、 Gxt 4 肯定 不 是 素数 ,假设 x 为 大 于 1 的 自然 数 
mns6 


if ml=1 and m!=5: 
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Print ('No') 
else: 
for i in range (3,int (nx*0.5)+1,2): 
迁 殉 =0: 
Print ("No') 
break 
else: 
print ('Yes') 
示例 4-5 编写 程序 ,计算 组 合 数 C(n,i) , 即 从 n 个 元 素 中 任 选 i 个 ,有 多 少 种 选 法 。 
根据 组 合 数 的 定义 ,可 以 编写 代码 如 下 : 


jimport math 


def nil(n,i): 
retum int (math. factorial (n) /math.factorial (i) /math.factorial (n- i)) 


虽然 在 Python 中 不 用 担心 数字 太 大 而 超过 变量 的 表示 范围 ,但 是 计算 大 整数 的 阶 
乘 也 确实 需要 一 些 时 间 ,尤其 是 上 面 的 函数 中 存在 大 量 的 重复 计算 ,严重 影响 速度 。 如 果 
把 组 合 数 的 定义 展开 并 化 简 一 下 的 话 可 以 发 现 其 中 隐藏 的 规律 ,以 Cni(8,3) 为 例 ， 
Cni(8,3) 王 81/31/(8 一 3)1 =(8X7X6X5X4X3X2X1)/(3X2X1)/(5X4X3X2xXx 
1) ,对 于 (5,8] 区 间 的 数 ,分 子 上 出 现 一 次 而 分 母 上 没 出 现 ;(3,5] 区 间 的 数 在 分 子 、 分 母 上 
各 出 现 一 次 ;[1,3] 区 间 的 数 分 子 上 出 现 一 次 而 分 母 上 出 现 两 次 。 根 据 这 一 规律 ,可 以 编 
写 如 下 非常 高 效 的 组 合 数 计算 程序 。 


def ni2(n,i): 
if not (isinstance (n, int) and isinstance (i,int) and n>=i): 
print (m and i mst be integers and n must be larger than or equal to i.') 
retum 
result=1 
Min, Ma sorted ((i,n- i)) 
for i in range(n,0,— 1): 
if i> Max: 
result* =i 
elif i<=Min: 
result /=i 
retum result 


Print (Cni2(6,2)) 

Python 标准 库 itertools 提供 了 组 合 函 数 combinations() ,排列 函数 permutations()、 
用 于 循环 遍历 可 和 迭代 对 象 元 素 的 函数 cycle() 、 根 据 一 个 序列 的 值 对 另 一 个 序列 进行 过 滤 
的 函数 compress()、 根 据 函 数 返回 值 对 序列 进行 分 组 的 函数 groupby() 、 返 回 包 含 无 限 连 
续 值 的 count 对 象 的 count 函数 〇 、 计 算 笛 卡 儿 积 的 函数 product() 等 。 下面 的 代码 演示 
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了 部 分 函数 的 用 法 。 


>>> import itertools 
>>> for 让 in itertools.ombinations (range (1,5),3): 
print (it,end= ' ') 
(1,2,3) (1,2,4) (1,3,4) (2,3,4) 
>>> list (itertools.pemrmtations([1,2,3,4],3)) 
>>> = itertools.pemmtations ([1,2,3,4],4) 
>>> for i in range (5): 
Print (next (x) ,end= ' ') 
(1,2,3,4) (1,2,4,3) (1,3,2,4) (1,3,4,2) (1,4,2,3) 
>>> = 'Private Key' 
>>> y= itertools.cycle (x) 
>>> for i in range(20) : 
Print (next (y) ,end= ', ') 
Brivat,e, ,KeyPrivat,e,K, 
>>> for i in range(5): 
Print (next (y) ,end= ', ') 
@yPri, 
>>> 二 range (1,20) 
>>>y= (1,0) * 9+ (1,) 
>>>y 
(1,0,1,0,1,0,1,0,1,0,1,0,1,0,1,0,1,0,1) 
>>> list (itertools.compress (x,y)) 
[1,3,5,7,9,11,13,15,17,19] 
>>> def group(v) : 
if v> 10: 
Teturn "greater than 10' 
elif ve 5: 
retum 'less than 5' 
else: 
Teturn "between 5 and 10" 
>>> 三 range (20) 
>>> 六 itertools.groupby (x, group) 
>>> for kv in y: 
Print (kK,':",l1ist(v)) 
less than 5 : [0,1,2,3,4] 
between 5 and 10 : [5,6,7,8,9,10] 
greater than 10 : [11,12,13,14,15,16,17,18,19] 
>>> ze itertools.oount (5,3) 
>>> for i in range (10): 
Print (next (x) ,end= ' ') 
581114172023262932 


# 从 4 个 元 素 中 选 3 个 元 素 的 组 合 


# 从 4 个 元 素 中 任 选 3 个 元 素 的 排列 
#4 个 元 素 的 全 排列 
# 输 出 前 5 个 排列 


# 循 环 遍历 序列 中 的 元 素 


# 根 据 一 个 序列 的 值 , 对 另 一 个 序列 进行 过 滤 


# 对 序列 元 素 进行 分 组 


# 起 始 值 为 5 步 长 为 3 的 cont 对象 
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>>> list (zip('abode',itertools.count ())) # count 对 象 中 的 元 素 个 数 是 无 穷 的 
[(0a'v0， (b',D),('c',2), ('d',3), ('e',4)] 
>>> list (zip('abc',itertools.count ())) 
[('a',0), (b',1), ('c',2)] 
>>> list (zip('abodefghi', itertools.count ())) 
[('a',O), (b',D),('c',2), ('d',3), ('e',4), ('f£',5), ('g',0), (h',7), ("i"',8)] 
>>> for item in itertools.product (‘abc', range (4)): # 笛 卡 儿 积 
Print (itemwend ' ') 
(av0) (a'l) (av2) (‘a',3) (b',0) (bl) (Yb',2) (bo3 (cv0) (co (cv2) (cov3) 
>>> for item in itertools.product('abc' '123" 'BC'): 
print (item,end= ' ') 
ty PL Ca Ce WY Cy (PY 
本 全 
人 
>>> func= lanbda x:x.isnumeric() 
>>> list (itertools.takewhile (func, "1234abcd)) # 过 滤 元 素 
[i | 
>>> list (itertools.dropwhile (func, '1234abod')) 


Vase 
示例 4-6 编写 代码 ,模拟 决赛 现场 最 终 成 绩 的 计算 过 程 。 


while True: 
try: 
int (input(' 请 输入 评委 人 数 : ')) 
ifn<=2;: 
print (" 评 委 人 数 太 少 ,必须 多 于 2 个 人 。') 
else: 
break 
except: 
Pass 


scores= [] 


for i in range (n): 
# 这 个 while 循 环 用 来 保证 用 户 必须 输入 o~ 100 之 间 的 数字 
while True: 
try: 

score= input (' 请 输入 第 {0} 个 评委 的 分 数 : '.fommat (i+1)) 
# 把 字符 串 转换 为 实数 
score= float (score) 
assert KK= soore<=100 
scores.append (score) 
# 如 果 数 据 合法 ,跳出 while 循环 ,继续 输入 下 一 个 评委 的 分 数 
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break 
except: 
print (' 分 数 错误 ') 


# 计算 并 删除 最 高 分 与 最 低 分 
highest= max (scores) 

lowest=min (scores) 

Scores.remove (highest) 

Scores.remove (lowest) 
finalSoore= round (sum(scores) /len (scores) ,2) 


fomatter= ' 去 掉 一 个 最 高 分 {0}\n 去 掉 一 个 最 低 分 {1}\n 最 后 得 分 {2}' 
Print (formatter.format (highest, lowest., finalSoore)) 


本 章 小 结 


(1) 在 Python 中 ,关系 运算 符 可 以 连用 。 

(2) 条 件 表达 式 的 值 只 要 不 是 False、0( 或 0.0、0j 等 )、 空 值 None、 空 列表 、 空 元 组 、 空 
集合 、 空 字典 、 空 字符 串 \、 空 range 对 象 或 其 他 空 迭 代 对 象 ,Python 解释 器 均 认为 与 True 
等 价 。 

(3) 关系 运算 符 和 好 辑 运 算 符 都 具有 惰性 求 值 的 特点 。 

(4) 编写 程序 时 ,一 定 要 注意 代码 的 缩 进 。 

(5) Python 中 的 for 循环 和 while 循环 都 可 以 带 有 else 子 句 。 


习 是 
4.1 分 析 迎 辑 运算 符 or 的 短路 求 值 特性 。 


4.2 编写 程序 ,运行 后 用 户 输入 4 位 整数 作为 年 份 ,判断 其 是 否 为 羡 年 。 如 果 年 份 
能 被 400 整除 , 则 为 闷 年 ;如 果 年 份 能 被 4 整除 但 不 能 被 100 整除 也 为 头 年 。 





4.3 Python 提供 了 两 种 基本 的 循环 结构 : 和 。 
4.4 编写 程序 ,生成 一 个 包含 50 个 随机 整数 的 列表 ,然后 删除 其 中 所 有 奇数 (提示 
从 后 向 前 删 ) 。 


4.5 编写 程序 ,生成 一 个 包含 20 个 随机 整数 的 列表 ,然后 对 其 中 偶数 下 标的 元 素 进 
行 降序 排列 ,奇数 下 标的 元 素 不 变 ( 提 示 : 使 用 切片 ) 。 

4.6 编写 程序 ,用 户 从 键盘 输入 小 于 1000 的 整数 ,对 其 进行 因 式 分 解 。 例 如 ,10= 
2X5,60 一 2X2X3X5。 

4.7 编写 程序 ,至 少 使 用 两 种 不 同 的 方法 计算 100 以 内 所 有 奇数 的 和 。 

4.8 ”编写 程序 ,输出 所 有 由 1、2、3、4 这 4 个 数字 组 成 的 素数 ,并 且 在 每 个 素数 中 每 
个 数字 只 使 用 一 次 。 

4.9 编写 程序 ,实现 分 段 函数 计算 ,如 下 所 示 : 
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在 软件 开发 过 程 中 ,经 常 有 很 多 操作 是 完全 相同 或 者 是 非常 相似 的 ,仅仅 是 要 处 理 的 
数据 不 同 而 已 ,因此 经 常会 在 不 同 的 代码 位 置 多 次 执行 相似 甚至 完全 相同 的 代码 块 。 很 
显然 ,从 软件 设计 和 代码 复 用 的 角度 来 讲 ,直接 将 代码 块 复制 到 多 个 相应 的 位 置 然后 进行 
简单 修改 绝对 不 是 一 个 好 主意 。 昌 然 这 样 可 以 使 得 多 份 复 制 的 代码 可 以 彼此 独立 地 进行 
修改 ,但 这 样 不 仅 增加 了 代码 量 ,也 增加 了 代码 阅读 、 理 解 和 维护 的 难度 ,为 代码 测试 和 纠 
错 带 来 很 大 的 困难 。 一 旦 被 复制 的 代码 块 将 来 某 天 被 发 现存 在 问题 而 需要 修改 ,必须 对 
所 有 的 复制 都 做 同样 的 正确 修改 ,这 在 实际 中 是 很 难 完成 的 一 项 任务 。 更 糟糕 的 情况 是 ， 
由 于 代码 量 的 大 幅度 增加 ,导致 代码 之 间 的 关系 更 加 复杂 ,很 可 能 在 修补 昌 漏 洞 的 同时 又 
引入 了 新 漏洞 ,维护 成 本 大 幅度 增加 。 因 此 ,应 尽量 减少 使 用 直接 复制 代码 的 方式 来 实现 
复 用 。 解 决 这 个 问题 的 有 效 方法 是 设计 函数 (function) 和 类 (class)。 本 章 介 绍 函 数 的 设 
计 与 使 用 ,第 6 章 介 绍 面 向 对 象 程序 设计 。 

将 可 能 需要 反复 执行 的 代码 封装 为 函数 ,然后 在 需要 该 功能 的 地 方 调用 封装 好 的 函 
数 , 不 仅 可 以 实现 代码 的 复 用 ,更 重要 的 是 可 以 保证 代码 的 一 致 性 ,只 需要 修改 该 函数 的 
代码 则 所 有 调用 位 置 均 得 到 体现 。 同 时 ,把 大 任务 拆 分 成 多 个 函数 也 是 分 治 法 的 经 典 应 
用 ,复杂 问题 简单 化 ,使 得 软件 开发 像 搭 积木 一 样 简单 。 当 然 ,在 实际 开发 中 ,需要 对 函数 
进行 良好 的 设计 和 优化 才能 充分 发 挥 其 优势 ,并 不 是 使 用 了 函数 就 万 事 大 吉 了 。 在 编写 
函数 时 ,有 很 多 原则 需要 参考 和 遵守 。 例 如 ,不 要 在 同一 个 函数 中 执行 太 多 的 功能 ,尽量 
只 让 其 完成 一 个 高 度 相 关 且 大 小 合适 的 功能 ,提高 模块 的 内 聚 性 。 另 外 ,尽量 减少 不 同 函 
数 之 间 的 隐 式 耦合 。 例 如 ,减少 全 局 变量 的 使 用 ,使 得 函数 之 间 仅 通过 调用 和 参数 传递 来 
显 式 体现 其 相互 关系 。 再 就 是 设计 函数 时 应 尽量 减少 副作用 ,只 实现 指定 的 功能 就 可 以 
了 ,不 要 做 多 余 的 事情 。 最 后 ,在 实际 项 目 开发 中 ,往往 会 把 一 些 通 用 的 函数 封装 到 一 个 
模块 中 ,并 把 这 个 通用 模块 文件 放 到 顶层 文件 夹 中 ,这 样 更 方便 管理 。 


5.1 函数 定义 与 使 用 


511 基本 语法 


在 Python 中 ,定义 函数 的 语法 如 下 : 
def 函数 名 ([ 参 数列 表 ]): 
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注释" 
函数 体 
在 Python 中 使 用 def 关键 字 来 定义 函数 ,然后 是 一 个 空格 和 函数 名 称 , 接 下 来 是 一 
对 括号 ,在 括号 内 是 形式 参数 列表 ,如 果 有 多 个 参数 则 使 用 逗号 分 隔 开 , 括 号 之 后 是 一 个 
冒号 和 换行 ,最 后 是 注释 和 函数 体 代 码 。 定 义 函数 时 在 语法 上 需要 注意 的 问题 主要 有 : 
中 函数 形 参 不 需要 声明 其 类 型 ,也 不 需要 指定 函数 的 返回 值 类 型 ; @ 即 使 该 函数 不 需要 
接收 任何 参数 ,也 必须 保留 一 对 空 的 括号 ; @ 括 号 后 面 的 冒号 必 不 可 少 ; 四 函数 体 相对 
于 def 关键 字 必 须 保持 一 定 的 空格 缩 进 。 
下 面 的 函数 用 来 计算 斐 波 那 契 数列 中 小 于 参数 n 的 所 有 值 : 


def fib(n): # 定 义 函 数 ,括号 里 的 n 是 形 参 
‘acospt an integer n. 
Teturn the mmbers less than n in Fibonacci sequenoe.''’ 
abr ll1 
while acn: 
Print (a,end= ' ') 
arbrbyatb 
Print() 
该 函数 的 调用 方式 为 
fib(1000) # 调 用 函数 ,括号 里 的 1000 是 实 参 


如 果 代 码 本 身 不 能 提供 非常 好 的 可 读 性 ,那么 最 好 加 上 适当 的 注释 来 说 明 。 在 定义 
函数 时 ,开头 部 分 的 注释 并 不 是 必需 的 ,如 果 为 函数 的 定义 加 上 一 段 注释 ,可 以 为 用 户 提 
供 友好 的 提示 和 使 用 帮助 。 例 如 ,可 以 使 用 内 置 函 数 help() 来 查看 函数 的 使 用 帮助 ,并 
旦 在 调用 该 函数 时 输入 左 侧 圆 括号 之 后 ,立刻 就 会 得 到 该 函数 的 使 用 说 明 , 如 图 5-1 
所 示 。 








me 
s less than n in Fibonacci sequence.”” 





au 1 
while a《 ni 


print (a, end=” ) 
=b, 


加 
print') 


>>> print (fib. doc__) 
accept an integer n. 
return the nunbers less than n in Fibonacci sequence. 
>>> help (fib) 
Help on function fib in nodule _ nain: 


fib(n) 


accept am integer n. 
return the nunbers less than mn in Fibonacci sequence. 


>>> fib 
(n) 
accept an integer n. , 
return the numbers less than n in Fibonacci sequence. 


5-1 使 用 注释 来 为 用 户 提示 函数 使 用 说 明 














在 Python 中 ,定义 函数 时 也 不 需要 声明 函数 的 返回 值 类 型 ,而 是 使 用 return 语句 结 
东 函 数 执行 的 同时 返回 任意 类 型 的 值 ,函数 返回 值 类 型 与 return 语句 返回 表达 式 的 类 型 
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一 致 。 不 论 return 语句 出 现在 函数 的 什么 位 置 , 一 旦 得 到 执行 将 直接 结束 函数 的 执行 。 
如 果 函 数 没 有 return 语句 、 有 return 语句 但 是 没有 执行 到 或 者 执行 了 不 返回 任何 值 的 
return 语句 ,解释 器 都 会 认为 该 函数 以 return None 结束 , 即 返 回 空 值 。 

在 编写 函数 时 ,应 尽量 减少 副作用 ,尽量 不 要 修改 参数 本 身 ,不 要 修改 除 返回 值 以 外 
的 其 他 内 容 。 另 外 ,应 充分 利用 Python 函数 式 编程 的 特点 ,让 自己 定义 的 函数 尽量 符合 
纯 函 数 式 编程 的 要 求 ,如 保证 线程 安全 、 可 以 并 行 运行 等 。 


512 函数 内 套 定义 、 可 调用 对 象 与 修饰 器 
1. 范 数 嵌 套 定义 


Python 允许 函数 的 藤 套 定义 ,在 函数 内 部 可 以 再 定义 另外 一 个 函数 。 在 2.4 节 有 一 
段 代 码 是 用 来 实现 可 迭代 对 象 与 数字 四 则 运算 的 ,当时 是 使 用 lambda 表达 式 实现 的 主要 
功能 ,如 果 使 用 函数 髓 套 定义 ,代码 可 以 写作 : 





>>> def myMep (iterable, op, value) : # 自 定义 函数 
if pnot in +—-#*/"': 
ITeturn 'Error operator’ 


def nested (item) : # 嵌 套 定义 函数 
returmn eval (repr (item)+ opt repr (value)) 
Teturn map (nested, iterable) # 使 用 在 函数 内 部 定义 的 函数 
>>> list tmp (range (5), "+ ',5)) # 调 用 外 部 函数 ,不 需要 关心 其 内 部 实现 


[5,6,7,8,9] 

>>> list (nyMap (range (5), '— ',5)) 
[5,-4-3,-2,-1] 

>>> list emyMap (range (5), ' * ',5)) 
[0,5,10, 15, 20] 

>>> list (nyMap (range (5), "/',5)) 
[0.0,0.2,0.4,0.6,0.8] 


下 面 的 函数 利用 函数 嵌 套 定义 和 递归 实现 帕斯卡 公式 CCn,iD 一 CCn 一 1, 让 十 C(n 一 
1, i 一 1) ,进行 组 合 数 CCn,i) 的 快速 求解 。 


Gef f2(n,i): 
cache2= dict () 


def fln,i): 
if r=ior i==0: 
retum 1 
elif (n,i) not in cache2: 
cache2[ (mn,i)]=f(0 1,i) +f(o1,i-1) 
Tetum cache?2[ (n,i)] 


retumn f(n,i) 
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尽管 函数 嵌 套 定义 使 用 很 方便 ,也 很 灵活 ,但 并 不 提倡 过 多 使 用 ,因为 这 样 会 导致 内 
部 的 函数 反复 定义 而 影响 执行 效率 。 


2. 可 调用 对 象 


函数 属于 Python 可 调用 对 象 之 一 ,由 于 构造 方法 的 存在 ,类 也 是 可 调用 的 。 像 list()、 
tuple() 、dict() \set() 这 样 的 工厂 函数 实际 上 都 是 调用 了 类 的 构造 方法 。 另 外 ,任何 包含 
__call _() 方 法 的 类 的 对 象 也 是 可 调用 的 。 下 面 的 代码 使 用 函数 的 肉 套 定义 实现 了 可 调 
用 对 象 的 定义 : 

Gef linear (a,b): 


def result (x) : # 在 Python 中 ,函数 是 可 以 嵌 套 定义 的 
retum axX+b 


Teturmn result # 返 回 可 被 调用 的 函数 
下 面 的 代码 演示 了 可 调用 对 象 类 的 定义 : 
class linear: 
def init _ (selfarb): 
self.a,self.b= ab 
Gef__call _ (self,x): # 这 里 是 关键 
retum self.ax x+self.b 
使 用 上 面 的 嵌 套 函数 和 类 这 两 种 方式 中 任何 一 种 ,都 可 以 通过 以 下 方式 来 定义 一 个 
可 调用 对 象 : 


taxesr= linear (0.3,2) 
然后 通过 以 下 方式 来 调用 该 对 象 : 


taxes (5) 


3. 修饰 器 


修饰 器 (decorator) 是 函数 嵌 套 定义 的 男 一 个 重要 应 用 。 修 饰 器 本 质 上 也 是 一 个 函 
数 , 只 不 过 这 个 函数 接收 其 他 函数 作为 参数 并 对 其 进行 一 定 的 改造 之 后 返回 新 函数 。 后 
面 第 6 章 中 的 静态 方法 .类 方法 、 属 性 等 也 都 是 通过 修饰 器 实现 的 ,Python 中 还 有 很 多 这 
样 的 用 法 。 下 面 的 代码 演示 了 修饰 器 的 定义 与 使 用 方法 ,定义 其 他 函数 调用 之 前 或 之 后 
需要 执行 的 通用 代码 ,可 作用 于 其 他 任何 函数 ,提高 代码 复 用 度 。 
Gef before (func) : # 定 义 修饰 器 
Gef wrapper (args,** kwargs) : 
print ('Before finction called. ') 
Tetum fanc (args,** kwargs) 
retum wrapper 


aef after (func) : # 定 义 修饰 器 
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Gef wrapper (args,** kwargs) : 
result= func (* args, * * kwargs) 
print ('After function called.') 
retum result 
retum wrapper 


@ before 
@ after 
def test (): # 同 时 使 用 两 个 修饰 器 改造 函数 


Print (3) 
# 调 用 被 修饰 的 函数 
test() 


和 预想 的 完全 一 样 ,上 面 代码 的 运行 结果 为 


Before function called. 
3 
After function called. 


513 函数 递归 调用 


函数 的 递归 调用 是 函数 调用 的 一 种 特殊 情况 ,函数 调用 自己 ,自己 再 调用 自己 ,自己 
再 调用 自己 …… , 当 某 个 条 件 得 到 满足 时 就 不 再 调用 了 ,然后 再 一 层 一 层 地 返回 ,直到 该 
函数 的 第 一 次 调用 ,如 图 5-2 所 示 。 


























函数 A 函数 B 。 函数 B 。 函数 B 函数 B 。 函数 B 
调用 
4 | 调用 | 调用 | 调用 调用 | 调用 
| 1 \/ LU 1 1 
"NN Nh 
返回 | 返回 “| 返回 返回 | 返回 
四 i 四 \ 


图 5-2 函数 递归 调用 示意 图 


函数 递归 通常 用 来 把 一 个 大 型 的 复杂 问题 层 层 转化 为 一 个 与 原来 问题 本 质 相同 但 规 
模 很 小 很 容易 解决 或 描述 的 问题 ,只 需要 很 少 的 代码 就 可 以 描述 解决 问题 过 程 中 需要 的 
大 量 重复 计算 。 下 面 的 代码 使 用 递归 计算 列表 中 所 有 元 素 之 和 ,尽管 在 Python 中 没有 
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def recursivesum(lst) : 
if Jen(1st)==1: 
return lst[0] 
return lst[0] + recursiveSum(1st [1:]) 


而 下 面 的 代码 则 使 用 递归 实现 了 整数 的 因数 分 解 ,函数 执行 结束 后 ,fac 中 包含 了 整 
数 num 因数 分 解 的 结果 。 


fram randcm import randint 


Gef factors (num, fac= []) : 
# 每 次 都 从 2 开始 查找 因数 
for i in range (2,int (nurm¥*0.5)+ 1): 
# 找 到 一 个 因数 
if numg i==0: 
fac.append (i) 
# 对 商 继续 分 解 ,重复 这 个 过 程 
factors (num//i, fac) 
# 注 意 ,这 个 break 非 常 重要 
break 
else: 
# 不 可 分 解 了 ,自身 也 是 个 因数 
fac.append (num) 


facs= [] 

re randint (2, 10** 8) 

factors (n, facs) 

result= ' * '.join (map (str, facs)) 

if r==eval (result): 

Print (n, '= "+ result) 

最 后 ,从 图 5-2 可 以 看 出 ,每 次 调用 函数 必须 记 住 离开 的 位 置 才能 保证 函数 运行 结束 
以 后 回 到 正确 的 位 置 ,这 个 过 程 称 为 保存 现场 ,这 需要 一 定 的 栈 空间 。 男 外 ,调用 一 个 函 
数 时 会 为 该 函数 分 配 一 个 栈 帧 ,用 来 存放 普通 参数 和 函数 内 部 局 部 变量 的 值 , 这 个 栈 帧 会 
在 函数 调用 结束 后 自动 释放 。 而 在 函数 递归 调用 的 情况 中 ,一 个 函数 执行 尚未 结束 就 又 
调用 了 自己 ,原来 的 栈 帧 还 没 释放 又 分 配 了 新 栈 帧 ,会 占用 大 量 的 栈 空 间 。 所 以 ,递归 深 
度 如 果 太 大 ,可 能 会 导致 栈 空间 不 足 进 而 导致 程序 崩溃 。 


5.2 函数 参数 





函数 定义 时 括号 内 是 使 用 逗号 分 隔 开 的 形 参 列表 (parameters) , 困 数 可 以 有 多 个 参 
数 ,也 可 以 没有 参数 ,但 定义 和 调用 时 一 对 括号 必须 有 ,表示 这 是 一 个 函数 并 且 不 接收 参 
数 。 调 用 函数 时 向 其 传递 实 参 (arguments) ,根据 不 同 的 参数 类 型 ,将 实 参 的 值 或 引用 传 
递 给 形 参 。 定 义 函 数 时 不 需要 声明 参数 类 型 ,解释 器 会 根据 实 参 的 类 型 自动 推断 形 参 类 
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型 ,在 一 定 程度 上 类 似 于 函数 重 载 和 泛 型 函数 的 功能 。 
一 般 来 说 ,在 函数 内 部 直接 修改 形 参 的 值 不 会 影响 实 参 。 例 如 : 


>>> def addone (a) : 


at=1 # 这 条 语句 会 得 到 一 个 新 的 变量 a 
>>> 二 3 
>>> addone (a) 
>>>a # 实 参 的 值 没有 受到 影响 


从 运行 结果 可 以 看 出 ,在 函数 内 部 修改 了 形 参 a 的 值 ,但 是 当 函 数 运行 结束 以 后 , 实 
参 a 的 值 并 没有 被 修改 。 然 而 ,列表 字典、 集合 这 样 的 可 变 序列 类 型 作为 函数 参数 时 ,如 
果 在 函数 内 部 通过 列表 、 字 典 或 集合 对 象 自身 的 方法 修改 参数 中 的 元 素 时 ,同样 的 作用 也 
会 体现 到 实 参 上 。 


>>> def modify (v) : # 修 改 列表 元 素 值 
Vv[O0]=v[0]+ 1 

>>> a [2] 

>>>modify(a) 

>>>a 

[3] 

>>> def modify (v, item) : # 为 列表 增加 元 素 
V.append (item) 

>>> a [2] 

>>>modify(a,3) 

>>>a 

[2,3] 

>>> def modify(d) : # 修 改 字典 元 素 值 或 为 字典 增加 元 素 
dl'age']=38 

>>> a {'name':'Dong', 'age' :37, 'sex': "Male'} 

>>>modify(a) 

>>>a 

{"'age': 38, 'name': 'Dong', 'sex': 'Male'} 

>>> def mdify(s,v): # 为 集合 添加 元 素 
3.add(v) 

>>> = {1,2,3} 

>>>modify(s,4) 

>>>s 


{1,2,3,4} 


也 就 是 说 ,如 果 传 递 给 函数 的 是 列表 、 字 典 、 集 合 或 其 他 自 定义 的 可 变 序列 ,并 且 在 函 
数 内 部 使 用 下 标 或 序列 自身 支持 的 方式 为 可 变 序 列 增加 、 删 除 元 素 或 修改 元 素 值 时 ,修改 
后 的 结果 是 可 以 反映 到 函数 之 外 的 , 即 实 参 也 得 到 了 相应 的 修改 。 

第 2 章 和 第 3 章 曾 经 多 次 提 到 ,Python 采用 的 是 基于 值 的 自动 内 存 管 理 模 式 , 变 量 
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并 不 直接 存储 值 ,而 是 存储 值 的 引用 。 从 这 个 角度 来 讲 , 在 Python 中 调用 函数 时 , 实 参 
到 形 参 都 是 传递 的 引用 。 也 就 是 说 ,Python 函数 不 存在 传 值 调用 。 


521 位 置 参数 


位 置 参数 (positional arguments) 是 比较 常用 的 形式 ,调用 函数 时 实 参 和 形 参 的 顺序 
必须 严格 一 致 ,并 且 实 参 和 形 参 的 数量 必须 相同 。 
>>> def da (asb,c) : # 所 有 形 参 都 是 位 置 参数 
print (a,b,c) 
>>> demp (3,4,5) 
345 
>>> dam (3,5,4) 
354 
>>> dam(1,2,3,4) # 实 参与 形 参 的 数量 必须 相同 
TypeError: demp() takes 3 positional arguments but 4 were given 


522 默认 值 参数 


在 定义 函数 时 ,Python 支持 默认 值 参 数 ,在 定义 函数 时 可 以 为 形 参 设置 默认 值 。 在 
调用 带 有 默认 值 参 数 的 函数 时 ,可 以 不 用 为 设置 了 默认 值 的 形 参 进行 传 值 ,此 时 函数 将 会 
直接 使 用 隐 数 定义 时 设置 的 默认 值 ,当然 也 可 以 通过 显 式 赋 值 来 蔡 换 其 默认 值 。 也 就 是 
说 ,在 调用 函数 时 是 否 为 默认 值 参数 传递 实 参 是 可 选 的 ,具有 较 大 的 灵活 性 ,在 一 定 程度 
上 类 似 于 函数 重 载 的 功能 ,同时 还 能 在 为 函数 增加 新 的 参数 和 功能 时 通过 为 新 参数 设置 
默认 值 来 保证 向 后 兼容 而 不 影响 老 用 户 的 使 用 。 需 要 注意 的 是 ,在 定义 带 有 默认 值 参数 
的 函数 时 ,任何 一 个 默认 值 参数 右边 都 不 能 再 出 现 没有 默认 值 的 普通 位 置 参数 ,否则 会 提 
示 语 法 错误 。 带 有 默认 值 参数 的 函数 定义 语法 如 下 : 

def 函数 名 (…, 形 参 名 = 默认 值 ): 

函数 体 

可 以 使 用 "函数 名 ._defaults “随时 查看 函数 所 有 默认 值 参 数 的 当前 值 , 其 返回 值 
为 一 个 元 组 ,其 中 的 元 素 依次 表示 每 个 默认 值 参数 的 当前 值 。 

>>> def say( message,times=1 ) : 

Print (message+ ' ') * times) 

>>> say。 _defaults _ 

(1,) 

调用 该 函数 时 ,如 果 只 为 第 一 个 参数 传递 实 参 , 则 第 二 个 参数 使 用 默认 值 1, 如 果 为 
第 二 个 参数 传递 实 参 , 则 不 再 使 用 默认 值 1, 而 是 使 用 调用 者 显 式 传递 的 值 。 

>>> say('hello') 


hello 
>>> say ("hello',3) 
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hello hello hello 


多 次 调用 函数 并 且 不 为 默认 值 参 数 传递 值 时 ,默认 值 参数 只 在 定义 时 进行 一 次 解释 
和 初始 化 ,对 于 列表 、 字 典 这 样 可 变 类 型 的 默认 值 参数 ,这 一 点 可 能 会 导致 很 严重 的 逻辑 
错误 ,而 这 种 错误 或 许 会 耗费 大 量 精力 来 定位 和 纠正 。 


>>> def demo (pewitem old list= []): 
old list.append (newitem) 
Teturn old list 


>>> print (dem('5" [1,2,3,4])) 

[1,2,3,4,'5'] 

>>> print (demp('aaa' ['a', 'b'])) 

['a', ‘b', 'aaa'] 

>>> print (dam ('a')) 

['a'] 

>>> print (demp ('b')) # 注 意 这 里 的 输出 结果 
['a', 'b'] 


上 面 的 函数 使 用 列表 作为 默认 参数 ,由 于 其 可 记忆 性 ,连续 多 次 调用 该 函数 而 不 给 该 
参数 传 值 时 ,再 次 调用 将 保留 上 一 次 调用 的 结果 。 一 般 来 说 ,要 避免 使 用 列表 、 字 典 、 集 合 
或 其 他 可 变 序列 作为 函数 参数 默认 值 ,对 于 上 面 的 函数 ,更 建议 使 用 下 面 的 写法 。 


Gef demp (newitem,old list=None): 
if old list is None: 
old list= [] 
old_ list.append (newitem) 
retum old list 


男 外 一 个 需要 注意 的 问题 是 ,如 果 在 定义 函数 时 某 个 参数 的 默认 值 为 男 一 个 变量 的 
值 ,那么 参数 的 默认 值 只 依赖 于 函数 定义 时 该 变量 的 值 , 或 者 说 函数 的 默认 值 参数 是 在 函 
数 定义 时 确定 值 的 .所 以 只 会 被 初始 化 一 次 。 例 如 : 


>>>3 

>>> def f(r=i): # 人 参数 n 的 值 仅 取决 于 i 的 当前 值 
Print (n) 

>>>£() 

3 

>>>i=5 # 函 数 定义 后 修改 i 的 值 不 影响 参数 n 的 默认 值 

>>>£0) 

3 

>>> 和 7 

>>>£0) 

3 

>>> def fr: # 重 新 定义 函数 
Print (n) 
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>>>£() 


523 关键 参数 


关键 参数 主要 指 调用 函数 时 的 参数 传递 方式 ,与 丽 数 定义 无 关 。 通 过 关键 参数 可 以 
按 参数 名 字 传 递 值 ,明确 指定 哪个 值 传递 给 哪个 参数 , 实 参 顺 序 可 以 和 形 参 顺序 不 一 致 ， 
但 不 影响 参数 值 的 传递 结果 ,避免 了 用 户 需要 牢记 参数 位 置 和 顺序 的 麻烦 ,使 得 函数 的 调 
用 和 参数 传递 更 加 灵活 方便 。 


>>> def demp (ab,c=5): 

Print (a,b,c) 
>>>demp(3,7) # 按 位 置 传递 参数 
375 


>>> dew (c=8,a= 9,b= 0) # 关 键 参数 
908 


524 可 变 长 度 参 数 


可 变 长 度 参数 在 定义 函数 时 主要 有 两 种 形式 : *parameter 和 *xparameter, 前 者 用 来 
接收 任意 多 个 实 参 并 将 其 放 在 一 个 元 组 中 ,后 者 接收 类 似 于 关键 参数 一 样 显 式 赋值 形式 
的 多 个 实 参 并 将 其 放 人 字典 中 。 

下 面 的 代码 演示 了 第 一 种 形式 可 变 长 度 参数 的 用 法 ,无 论调 用 该 函数 时 传递 了 多 少 
实 参 ,一 律 将 其 放 入 元 组 中 : 


>>> def demp ftp) : 
Print (p) 

>>> dem (1,2,3) 

(1,2,3) 

>>> dem (1,2,3,4,5,6,7) 

(1,2,3,4,5,6,7) 


下 面 的 代码 演示 了 第 二 种 形式 可 变 长 度 参数 的 用 法 , 即 在 调用 该 函数 时 自动 将 接收 
的 参数 转换 为 字典 : 


>>> def demp fxP) : 
for item in p.items () : 
Print (item) 
>>> dam (1 产 2 于 3 引 
(Y"52) 
(‘x',l) 
('2',3) 


Python 定义 函数 时 可 以 同时 使 用 位 置 参数 .关键 参数 .默认 值 参数 和 可 变 长 度 参 数 ， 
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但 是 除非 真 的 很 必要 ,否则 不 要 这 样 做 ,因为 这 会 使 得 代码 非常 混乱 而 严重 降低 可 读 性 ， 
并 导致 程序 查 错 非常 困难 。 另 外 ,一 般 而 言 , 如 果 一 个 函数 可 以 接收 很 多 不 同类 型 的 参 
数 , 很 可 能 是 函数 设计 得 不 好 。 例 如 ,函数 功能 过 多 .需要 进行 必要 的 拆 分 和 重新 设计 ,以 
满足 模块 高 内 聚 的 要 求 。 


525 传递 参数 时 的 序列 解 包 


与 可 变 长 度 的 参数 相反 ,这 里 的 序列 解 包 是 指 实 参 ,同样 也 有 * 和 xx 两 种 形式 。 调 用 
含有 多 个 位 置 参数 (positional arguments) 的 函数 时 ,可 以 使 用 Python 列表 ,元 组 ,集合 、 
字典 以 及 其 他 可 和 迭代 对 象 作为 实 参 ,并 在 实 参 名 称 前 加 一 个 星 号 ,Python 解释 器 将 自动 
进行 解 包 , 然 后 把 序列 中 的 值 分 别传 递 给 多 个 单 变量 形 参 。 














>>> def deamp(abyc) : # 可 以 接收 多 个 位 置 参数 的 函数 
print (at bt c) 

>>> seqr [1,2,3] 

>>> dam (seq) # 对 列表 进行 解 包 


6 

>>> tup= (1,2,3) 

>>> dam getup) # 对 元 组 进行 解 包 
6 

>>> dic= {1:'a',2:'b',3:'c'} 


>>> dam (dic) # 对 字典 的 键 进行 解 包 
6 

>>> dam edic.values()) # 对 字典 的 值 进 行 解 包 
abc 

>>> Set= {1,2,3} 

>>> dam (Set) # 对 集合 进行 解 包 


6 

如 果实 参 是 个 字典 ,可 以 使 用 两 个 星 号 x** 对 其 进行 解 包 , 会 把 字典 转换 成 类 似 于 关键 
参数 的 形式 进行 参数 传递 。 对 于 这 种 形式 的 序列 解 包 ,要 求实 参 字典 中 的 所 有 键 都 必须 
是 函数 的 形 参 名 称 , 或 者 与 函数 中 两 个 星 号 的 可 变 长 度 参 数 相对 应 。 





>>>p {'a':l, b':2, 'c':3} # 要 解 包 的 字典 

>>> def f(ab,c=5): # 带 有 位 置 参 数 和 默认 值 参数 的 函数 
Print (a,b,c) 

>>> f(xp) 

i123 

>>> def fe= 3br4c=- 引 : # 带 有 多 个 默认 值 参数 的 函数 
print aubyc) 

>>> Eeexp) # 对 字典 元 素 进行 解 包 

在 ] 

>>> def damp exp) : # 接 收 字典 形式 可 变 长 度 参 数 的 函数 


for item in p.items(): 
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print (item) 

Pop {x YY2 2's3 

>>> dam gexp) # 对 字典 元 素 进行 解 包 
('yY',2) 

('z',3) 

(了 


如 果 一 个 函数 需要 以 多 种 形式 来 接收 参数 ,定义 时 一 般 把 位 置 参数 放 在 最 前 面 , 然 后 
是 默认 值 参数 , 接 下 来 是 一 个 星 号 的 可 变 长 度 参 数 ,最 后 是 两 个 星 号 的 可 变 长 度 参 数 ; 调 
用 函数 时 ,一 般 也 按照 这 个 顺序 进行 参数 传递 。 调 用 函数 时 如 果 对 实 参 使 用 一 个 星 号 * 
进行 序列 解 包 , 那 么 这 些 解 包 后 的 实 参 将 会 被 当 作 普 通 位 置 参数 对 待 ,并 且 会 在 关键 参数 
和 使 用 两 个 星 号 xx* 进 行 序列 解 包 的 参数 之 前 进行 处 理 。 


>>> def da (a,b,o) : # 定 义 函 数 
Print (a,b,c) 
>>> dam (1,2,3)) # 调 用 ,序列 解 包 
123 
>>> dam(Lx (2,3)) # 位 置 参 数 和 序列 解 包 同 时 使 用 
123 
>>> dam (1,* (2,),3) 
2 
>>> dam (a= 1,* (2,3)) # 一 个 星 号 的 序列 解 包 相 当 于 位 置 参 数 
# 优 先 处 理 , 引 发 异常 
TypeError: demp () got multiple values for argument 'a" 


>>> dam (= 1,* (2,3)) # 重 复 给 b 赋 值 ,引发 异常 

TypeError: demp () got multiple values for argument 'b' 

>>> dam(c=lx (2,3)) # 一 个 星 号 的 序列 解 包 相 当 于 位 置 参数 
# 优 先 处 理 

S31 

>>> dam ex {'a':l, b':2}, * (3,)) # 序 列 解 包 不 能 在 关键 参数 解 包 之 后 

SyntaxError: iterable argument unpacking follows keyword argument unpacking 

>>>dempke G,) xx fra':l mb'32]) # 一 个 星 号 的 序列 解 包 相 当 于 位 置 参 数 


# 优 先 处 理 , 引 发 异常 
TypeError: demp () got multiple values for argument 'a" 
>>> dam ( (3,) ,xx {'c':1, b':2}) 
区 


5.3 变量 作用 域 


变量 起 作用 的 代码 范围 称 为 变量 的 作用 域 .不 同 作用 域内 同名 变量 之 间 互 不 影响 ,就 
像 不 同文 件 夹 中 的 同名 文件 之 间 互 不 影响 一 样 。 在 函数 外 部 和 在 函数 内 部 定义 的 变量 ， 
其 作用 域 是 不 同 的 ,函数 内 部 定义 的 变量 一 般 为 局 部 变量 ,在 函数 外 部 定义 的 变量 为 全 局 
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变量 。 不 管 是 局 部 变量 还 是 全 局 变量 ,其 作用 域 都 是 从 定义 的 位 置 开始 的 ,在 此 之 前 无 法 
访问 。 

在 函数 内 定义 的 局 部 变量 只 在 该 函数 内 可 见 , 当 函数 运行 结束 后 ,在 其 内 部 定义 的 所 
有 局 部 变量 将 被 自动 删除 而 不 可 访问 。 在 函数 内 部 使 用 global 定义 的 全 局 变量 当 函 数 结 
束 以 后 仍然 存在 并 且 可 以 访问 。 

如 果 在 函数 内 部 修改 一 个 定义 在 函数 外 的 变量 值 ,必须 使 用 global 明确 声明 ,否则 
会 自动 创建 新 的 局 部 变量 。 在 函数 内 部 通过 global 关键 字 来 声明 或 定义 全 局 变量 ,这 分 
两 种 情况 。 

(1) 一 个 变量 已 在 函数 外 定义 ,如 果 在 函数 内 需要 修改 这 个 变量 的 值 , 并 将 修改 的 结 
果 反 映 到 函数 之 外 ,可 以 在 函数 内 用 关键 字 global 明确 声明 要 使 用 已 定义 的 同名 全 局 
变量 。 

(2) 在 函数 内 部 直接 使 用 global 关键 字 将 一 个 变量 声明 为 全 局 变量 ,如 果 在 函数 外 
没有 定义 该 全 局 变量 ,在 调用 这 个 函数 之 后 ,会 创建 新 的 全 局 变量 。 

或 者 说 ,也 可 以 这 么 理解 : @ 在 函数 内 如 果 只 引用 某 个 变量 的 值 而 没有 为 其 赋 新 值 ， 
该 变量 为 ( 隐 式 的 ) 全 局 变量 ; @ 如 果 在 函数 内 某 条 代码 有 为 变量 赋值 的 操作 ,该 变量 就 
被 认为 是 ( 隐 式 的 ) 局 部 变量 ,除非 在 函数 内 赋值 操作 之 前 显 式 地 用 关键 字 global 进行 了 
声明 。 


下 面 的 代码 演示 了 局 部 变量 和 全 局 变量 的 用 法 。 


>>> def dem(): 
glcbal x # 声 明 或 创建 全 局 变量 ,必须 在 使 用 x 之 前 执行 
入 3 # 修 改 全 局 变量 的 值 
ee # 局 部 变量 
Print (x,y) 
>>>x=5 # 在 函数 外 部 定义 了 全 局 变量 x 
>>> dam() # 本 次 调用 修改 了 全 局 变量 x 的 值 
34 
>>>x 
等 
>>>y # 局 部 变量 在 函数 运行 结束 之 后 自动 删除 ,不 再 存在 
NameError: name 'Y' is not defined 
>>>delx # 删 除了 全 局 变量 x 


>>>x 

NemePrror: name 'x" is not defined 

>>> dam() # 本 次 调用 创建 了 全 局 变量 
34 

>>>x 

3 


如 果 在 某 个 作用 域内 有 为 变量 赋值 的 操作 ,那么 该 变量 将 被 认为 是 该 作用 域内 的 局 
部 变量 ,这 一 点 一 定 要 引起 注意 。 
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>>> 王 10 # 全 局 变量 

>>> Gef dem(): 
Print (x) # 这 条 语句 会 引发 异常 ,因为 x 变量 现在 还 不 存在 
二 对 1 # 赋 值 语句 ,x 将 被 认为 是 该 作用 域内 的 局 部 变量 
Print (x) 

>>> demp () 


UnboundLocalFrror: local variable 'x' referenced before assignment 


如 果 局 部 变量 与 全 局 变量 具有 相同 的 名 字 , 那 么 该 局 部 变量 会 在 自己 的 作用 域内 暂 
时 隐藏 同名 的 全 局 变量 。 


>>> def demp(): 


一 3 # 创 建 了 局 部 变量 ,并 自动 隐藏 了 同名 的 全 局 变量 
Print (x) 

>>> 关 5 # 创 建 全 局 变量 

>>>x 

5 

>>> demp () 

3 


>>>x # 函数 调用 结束 后 ,不 影响 全 局 变量 x 的 值 
上 


s.4 lambda 表达 式 


lambda 表达 式 常用 来 声明 匿名 函数 , 即 没 有 函数 名 字 的 临时 使 用 的 小 函数 ,常用 在 
临时 需要 一 个 类 似 于 函数 的 功能 但 又 不 想 定义 函数 的 场合 。 例 如 ,内 置 函数 sorted() 和 
列表 方法 sort() 的 key 参数 ,内 置 函数 map() 和 filter() 的 第 一 个 参数 ,等 等 。lambda 表 
达 式 只 可 以 包含 一 个 表达 式 ,不 允许 包含 其 他 复杂 的 语句 ,但 在 表达 式 中 可 以 调用 其 他 函 
数 ,该 表达 式 的 计算 结果 相当 于 函数 的 返回 值 。 下 面 的 代码 演示 了 不 同情 况 下 lambda 表 
达 式 的 应 用 。 





>>> f= lanbda x,y,2: xt yt z # 也 可 以 给 larbda 表达 式 起 个 名 字 
>>> print (£(1,2,3)) # 把 lanbda 表达 式 当 作 函 数 使 用 
6 

>>> Flanbda wy=2,2=3: xtytz # 支 持 默认 值 参数 


>>>print (g(1)) 

6 

>>>print (g(2,= 4,5)) # 调 用 时 使 用 关键 参数 
1 

>>> I [ (larbda x: se*2), (lanbda x: we*3), (larbda x: we*4)] 

>>> print (L[0] (2) ,£5[1] (2),L[2] (2)) 

4816 

>>> 0- {£1': (larbda: 2+ 3), 'f2': (lanbda: 2x 3), '£3': (larbda: 2*3)} 
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>>>print (D['f£1"] () ,D['f£2"] (),D['£3"] 0) 
568 
>>>IF [1,2,3,4,5] 
>>> list map (lanbda x: x+ 10,5)) # lanbda 表 达 式 作为 函数 参数 
[11,12,13,14,15] 
>>> def demp(n) : 
Teturn nx 
>>> dero (5) 
25 
>>>a_list= [1,2,3,4,5] 
>>> List fmap (larbda x: dero (x) ,a_list)) # 在 lanbda 表 达 式 中 可 以 调用 函数 
[1,4,9,16,25] 
>>> data= list (range (20)) 
>>> import randcm 
>>> randcm.shuffle (data) 
>>> data 
[4,3,11v13,12,15, 9,2,10,6,19,18,14,8,0,7,5,17,1,16] 
>>> data.sort (key= lanbda x: *) # 用 在 列表 的 sort() 方 法 中 ,作为 函数 参数 
>>> data 
[0,1,2,3,4, 5, 6, 7,8, 9,10,11,12,13,14,15,16,17,18,19] 
>>> data.sort (key= lanbda x: len(str (x))) # 使 用 lambca 表达 式 指定 排序 规则 
>>> data 
[0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15, 16,17,18,19] 
>>> data.sort (key= larbda x: len(str (x)),reverse= True) 
>>> data 
[10,11,12,13, 14,15,16,17,18,19,0,1,2,3, 4,5, 6,7,8,9] 


在 使 用 lambda 表达 式 时 ,要 注意 变量 作用 域 可 能 会 带 来 的 问题 。 例 如 ,下 面 的 代码 
中 变量 x 是 在 外 部 作用 域 中 定义 的 ,对 lambda 表达 式 而 言 不 是 局 部 变量 ,从 而 导致 出 现 
了 错误 。 


>>> 二 [] 
>>> for x in range (10): 
I.append (larbda: xx**2) 
>>>rD] (0 # 请 自行 验证 r[0] 0、r[2] 0、r[3] 0 和 其 他 几 个 
81 
>>> 交 3 
>>>r[1]() 
1 


而 修改 为 下 面 的 代码 , 则 可 以 得 到 正确 的 结果 。 


>>> 王 [] 

>>> for x in range(10): 
r.append (lanbda n=x: mxx2) 

>>>r[0] 0 
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0 

>>>r[1]() 

1 

>>>r[5] 0) # 请 自行 验证 其 他 几 个 

5 

或 许 下 面 这 个 例子 更 能 说 明 问 题 ,这 里 的 lambda 表达 式 相 当 于 只 有 一 条 return i 语 
名 的 小 函数 ,调用 时 真正 的 返回 值 取决 于 全 局 变量 i 的 当前 值 。 

>>> 全 lambda :i 

>>> 应 3 

>>> 王 () 

3 

>>> 放 5 

>>>£() 

5 


最 后 应 注意 ,虽然 使 用 lambda 表达 式 可 以 很 方便 灵活 地 定义 一 些小 函数 ,但 是 ,如 果 
仅仅 是 需要 一 个 简单 的 运算 ,那么 应 该 尽量 使 用 标准 库 operator 中 提供 的 函数 ,避免 自 
己 定义 lambda 表达 式 ,operator 中 的 函数 执行 效率 更 高 一 些 。 


5.5 生成 器 函数 设计 要 点 


包含 yield 语句 的 函数 可 以 用 来 创建 生成 器 对 象 , 这 样 的 函数 也 称 为 生成 器 函数 。 
yield 语句 与 return 语句 的 作用 相似 ,都 是 用 来 从 函数 中 返回 值 。return 语句 一 旦 执行 会 
立刻 结束 函数 的 运行 ,而 每 次 执行 到 yield 语句 并 返回 一 个 值 之 后 会 暂停 或 挂 起 后 面 代码 
的 执行 ,下 次 通过 生成 器 对 象 的 、_next__() 方 法 .内 置 函 数 next() for 循环 遍历 生成 器 对 
象 元 素 或 其 他 方式 显 式 “索要 ”数据 时 恢复 执行 。 生 成 器 具有 情 性 求 值 的 特点 ,适合 大 数据 
处 理 。 下 面 的 代码 演示 了 如 何 使 用 生成 器 来 生成 斐 波 那 契 数 列 ， 


>>> def £(): 
arb= li1 # 序 列 解 包 , 同 时 为 多 个 元 素 赋值 
while True: 
yielda # 暂 停 执行 ,需要 时 再 产生 一 个 新 元 素 
abrbyatb # 序 列 解 包 ,继续 生成 新 元 素 
>>>a=f£() # 创 建生 成 器 对 象 
>>> for i in range(10): # 斐 波 那 契 数列 中 前 10 个 元 素 


print(a. _next _(),end-' ') 
11235813213455 
>>>foriinf(0: # 斐 波 那 契 数列 中 第 一 个 大 于 100 的 元 素 
if£ i> 100: 
Print (i,end=" ') 
break 
144 
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>>>a=f£() # 创 建生 成 器 对 象 
>>> next (a) # 使 用 内 置 函 数 next () 获 取 生 成 器 对 象 中 的 元 素 
主 
>>> next (a) # 每 次 索取 新 元 素 时 ,由 Yield 语 句 生成 
1 
>>>a. next _() # 也 可 以 调用 生成 器 对 象 的 ”next _() 方 法 
2 
>>>a. next _() 
3 
>>> def £(): 
yield fram 'abodefg' # 使 用 yield 表 达 式 创建 生成 器 
>>>=£() 
>>> next (x) 
ai 
>>> next (x) 
ob 
>>> for item in x: # 输 出 x 中 的 剩余 元 素 


Print (itemend= ' ') 


cdefg 

>>> def gen(): 
yield 1 
yield2 
yield 3 


>>>XrY 2 gen() # 生 成 器 对 象 支持 序列 解 包 


Python 标准 库 itertools 提供 了 一 个 count(start，step) 函数 ,用 来 连续 不 断 地 生成 无 
穷 个 数 ,这 些 数 中 的 第 一 个 数 是 start( 默 认为 0) , 相 邻 两 个 数 的 差 是 step( 默 认为 1) 。 下 
面 的 代码 使 用 生成 器 模拟 了 标准 库 itertools 中 的 count() 函 数 。 


>>> def count (start, step) : 


Du Start 
while True: # 无 穷 循环 
Yield nm # 返 回 一 个 数 ,暂停 执行 ,等 待 下 一 次 索要 数据 
mum += step 
>>> 三 count (3,5) 


>>> for i in range (10): 
Print (next (x) ,end= ' ') 
3813 18 23 28 33 38 43 48 
>>> for i in range(10): 
Print (next (x) ,end= " ') 
53 58 63 68 73 78 83 88 93 % 
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5.6 精彩 案例 赏析 


示例 5-1 编写 函数 ,接收 任意 多 个 实数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 所 有 参 
数 的 平均 值 ,其 他 元 素 为 所 有 参数 中 大 于 平均 值 的 实数 。 


def demp (para) : 
avg= sum(para) /len (para) # 平 均值 
= [i for i in para if i> avg] # 列 表 推 导 式 


retum (avg,) + tuple(g) 


示例 5-2 编写 函数 ,接收 字符 串 参 数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 大 写字 母 
个 数 ,第 二 个 元 素 为 小 写字 母 个 数 。 


aef demp(s) : 
result= [0,0] 
for ch in s: 
让 ch.islower(): 
result[1] +=1 
elif ch.isupper(): 
result[0] +=1 
retum tuple (result) 


示例 5-3 ”编写 函数 ,接收 包含 n 个 整数 的 列表 lst 和 一 个 整数 k(0 二 k 二 n) 作 为 参 
数 , 返 回 新 列表 。 人 处 理 规则 为 : 将 列表 lst 中 下 标 k 之 前 的 元 素 逆序 ,下 标 k 之 后 的 元 素 
逆序 ,然后 将 整个 列表 lst 中 的 所 有 元 素 逆 序 。 


def dem (lst,k) : 
1lst[k-1::-1] 
疡 lst[:k-1:-1] 


retum list (reversed (x+ y)) 


本 例 描 述 的 实际 上 是 将 列表 循环 左 移 k 位 的 算法 实现 ,下 面 的 代码 使 用 了 更 加 直接 
的 方法 ,但 对 于 长 列表 来 说 效率 远 不 如 上 面 的 代码 高 ,因为 pop(0) 操 作 在 列表 首部 删除 
元 素 ,这 会 引起 大 量 元 素 的 前 移 。 
Gef demp (1st,k): 
temp= 1st[:] 
for i in range(k): 
temp.append(temp-pop (0)) 
retumn temp 
搞 清楚 问题 的 本 质 以 后 ,对 于 本 例 中 描述 的 问题 ,使 用 切片 可 以 直接 实现 ,可 以 达到 
最 快 的 速度 。 


def ero (1st,k): 
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retumn 1st[k:] +1st[:k] 
Python 标准 库 collections 提供 的 双 端 队列 可 以 直接 实现 循环 左 移 位 和 右 移 位 ,更 加 
灵活 方便 。 
>>> fram collections import deque 
>>> q- deque (range (20)) 考 创建 双 端 队列 
>>> q.rotate (3) # 循 环 右 移 位 
>>>q 
deque ([17,18,19,0,1,2,3,4,5,6,7,8,9,10,11, 12,13,14, 15, 16]) 
>>> q.rotate(- 3) # 循 环 左 移 位 
>>>q 


deque ([0,1,2,3,4,5,6,7,8,9,10,11,12,13, 14,15,16,17,18,19]) 
示例 5-4 ”编写 函数 ,接收 一 个 整数 t 作 为 参数 ,打印 杨辉 三 角 前 t 行 。 


Gef yanghui (t): 
Print ([1]) 
line= [1,1] 
Print (line) 
for i in range(2,t): 
三 [] 
for j in range (0,1en(line)- 1): 
r.append (line[j]+ line[j+1]) 
line= [1]+ r+ [1] 
Print (line) 
示例 5-5 编写 函数 ,使 用 collections 标准 库 的 defaultdict 类 实现 上 例 的 功能 。 
杨辉 三 角 也 可 以 使 用 Python 标准 库 collections 提供 的 defaultdict 类 来 实现 ,也 就 是 
带 默认 值 的 字典 。 如 果 需 要 访问 defaultdict 类 的 对 象 中 某 个 特定 的 值 但 不 存在 时 ,不 会 
抛 出 异常 ,而 是 会 给 出 一 个 默认 值 。 


fram collections import defaultdict 


Gef yanghui On) : 
# 所 有 元 素 默认 值 为 0 
triangle= defaultdict (int) 
for row in range (n): 
# 每 行 第 一 个 元 素 为 1 
triangle[row,0]=1 
print (triangle[row,0],end= "\t') 
# 生 成 该 行 后 续 元 素 
for col in range(l,rowt 1): 
# 如 果 指 定位 置 的 元 素 不 存在 ,默认 为 0 
triangle[row, co1]= triangle[row- lv,col- 1] +triangle[row- lvcol] 
Print (triangle[row,col],end= "\t') 
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Print() 


yanghui (14) 
示例 5-6 编写 函数 ,接收 一 个 正 偶数 作为 参数 ,输出 两 个 素数 ,并 且 这 两 个 素数 之 
和 等 于 原来 的 正 偶数 。 如 果 存 在 多 组 符合 条 件 的 素数 , 则 全 部 输出 。 


Gef demp (n): 
Gef IsPrime (p): 

if p=2: 
ITeturn True 

if ps2==0: 
return False 

for i in range(3,int (p**0.5)+1,2): 
if ps i==0: 

retum False 
retum True 


if isinstance (n, int) and n> 0 and ng =0: 
for i in range(2,n//2+ 1): 
if IsPrime (i) and IsPrime (n- i): 
print (i, + wp 一 on) 
示例 5-7 编写 函数 ,接收 两 个 正 整 数 作为 参数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 
最 大 公约 数 ,第 二 个 元 素 为 最 小 公 倍 数 。 


aef dem (m,n): 
Fm*n 
while mn!=0: 
mernmn 
retum (n,p//n) 


另外 ,Python 标准 库 fractions 中 提供 了 gcd() 函数 用 来 计算 最 大 公约 数 , 在 Python 
3.5 和 更 新 版 本 中 ,标准 库 math 也 提供 了 计算 最 大 公约 数 的 函数 gcd()。 利 用 gcd() 函 
数 , 上 面 的 代码 也 可 以 写作 : 


Gef dem (taun) : 
import math 
天 math.gcd(mn) 
retum (r, nx n)//r) 
示例 5-8 ”编写 函数 ,接收 一 个 所 有 元 素 值 都 不 相等 的 整数 列表 x 和 一 个 整数 n, 要 
求 将 值 为 n 的 元 素 作为 支点 ,将 列表 中 所 有 值 小 于 n 的 元 素 全 部 放 到 n 的 前 面 ,所 有 值 大 
于 nm 的 元 素 放 到 n 的 后 面 。 


def dam (x,n) : 
tl=[i foriinxif i<n] 
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to [i foriinxif i>n] 
retum tl + fn] +t2 


上 面 的 代码 已 经 很 棒 了 ,只 是 还 有 一 点 小 瑕 盖 。 这 段 代码 使 用 了 两 个 列表 推导 式 ,对 
列表 x 中 的 元 素 扫描 了 两 遍 。 下 面 的 代码 虽然 看 起 来 长 了 一 点 ,但 是 只 需要 对 列表 中 的 
元 素 扫描 一 遍 就 能 得 到 结果 ,对 于 长 列表 而 言 执行 效率 还 是 有 很 大 提升 的 。 


Gef demp (xn) : 
tb=D 
t=[] 
for i in x: 
if i<n: 
t1.append(i) 
elif i>n: 
t2.append(i) 
retum tl + [n] +t2 


示例 5-9 ”编写 函数 ,计算 字符 串 匹 配 的 准确 率 。 
以 打字 练习 程序 为 例 , 假 设 origin 为 原始 内 容 ,userInput 为 用 户 输入 的 内 容 , 下 面 的 
代码 用 来 测试 用 户 输入 的 准确 率 。 


Gef Rate (originvuserInput) : 
if not (isinstance (origin, str) and isinstance (userInput,str)) : 
Print ("The two Parameters must be strings.') 
retum 
right= sum( (1 for oru in zip(originvuserInput) if o==u)) 
Tetum round (right/len(origin) ,2) 


示例 5-10 编写 函数 ,使 用 非 递 归 方法 对 整数 进行 因数 分 解 。 


fram randcm import randint 
fram math jimport scpt 


def factoring tn) : 
"'"' 对 大 数 进行 因数 分 解 '"' 
if net isinstance (n, int): 
Print ('You mst give me an integer') 
retum 
# 开 始 分 解 ,把 所 有 因数 都 添加 到 resut 列 表 中 
result= [] 
for p in primes: 
while n!=1: 
if Bp-=0: 
n/p 
result.append (p) 
else: 
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else: 
Tesult= % '.join (map (str, result)) 
Teturn result 
# 考 虑 参数 本 身 就 是 素数 的 情况 
if not result: 
retumn 


testData= [randint (10, 100000) for i in range(50)] 

# 随 机 数 中 的 最 大 数 

maxData= max (testData) 

# 小 于 maxpata 的 所 有 素数 

Primes= [ p for p in range(2,maxData) if 0 not in 
[psd for din range(2,int (sqrt (p))+1)] ] 


for data in testData: 
= factoring (data) 
Print (data, = ',r) 
# 测 试 分 解 结果 是 否 正确 
Print (data== eval (r)) 


示例 5-11 编写 函数 模拟 猜 数 游戏 。 系 统 随机 产生 一 个 数 , 玩 家 最 多 可 以 猜 5 次 , 系 
统 会 根据 玩家 的 猜测 进行 提示 ,玩家 则 可 以 根据 系统 的 提示 对 下 一 次 的 猜测 进行 适当 
调整 。 


fram randcm import randint 


def guess (maxValue= 100,maxTimes= 5) : 
# 随 机 生成 一 个 整数 
value= randint (1,maxValue) 
for i in range (maxTimes) : 
Prampt= 'Start to Guess:' if i==0 else 'Guess again:' 
# 使 用 异常 处 理 结构 ,防止 输入 不 是 数字 的 情况 
try: 
六 int (input Orompt)) 
except: 
Print (Must input an integer between 1 and ',maxValue) 
else: 
# 猜 对 了 
if x==Vvalue: 
Print ('Congratulations!') 
break 
elif x> value: 
Print ("Too big') 
else: 
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Print(Too little') 
else: 
# 次 数 用 完 还 没 猜 对 ,游戏 结束 ,提示 正确 答案 
print ('Game over. FAIL.') 
print ("The value is ',value) 


示例 5-12 编写 函数 ,计算 形式 如 a 十 aa 十 aaa 十 aaaa 十 … 十 aaa…aaa 的 表达 式 的 值 ， 
其 中 a 为 小 于 10 的 自然 数 。 


Gef dem(wn) : 
assert type (n)== int and 0< w 10, 'v mst be integer between 1 and 9" 
result,t=0,0 
for i in range (n): 
t=t*10+v 
result +=t 
retum result 


Print dem(3,4)) 
上 面 的 代码 散发 着 浓 浓 的 C 语 言 气息 ,而 下 面 的 代码 则 更 加 Pythonic。 


Gef demp2 (a, n): 
a str(a) 
result= sum(eval (ax i) for i in range(l,n+ 1)) 
retum result 


示例 5-13 编写 函数 模拟 报 数 游戏 。 有 n 个 人 围 成 一 圈 , 顺 序 编 号 ,第 一 个 人 开始 
从 1 到 kk( 假 设 k=3) 报 数 ,报到 上 的 人 退出 圈子 ,然后 圈子 缩小 ,从 下 一 个 人 继续 游戏 , 问 
最 后 留 下 的 是 原来 的 第 几 号 。 


fram itertools import cycle 


aef dam (1st,h): 

# 切 片 ,以 免 影响 原来 的 数据 
t 1st=1st[:] 
# 游 戏 一 直 进 行 到 只 剩 下 最 后 一 个 人 
while len(t 1st)>1: 

# 创 建 cycle 对 象 

c=cycle(t lst) 

# 从 1 到 k 报 数 

for i in range (k) : 

t=next (c) 

# 一 个 人 出 局 ,圈子 缩小 

indes—t 1st.index(t) 

t lst=t lst[indext 1:] +t lst[:index] 
# 游 戏 结束 
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retumn t 1st[0] 


Jst List (range (1, 11)) 
Print (Gemp (1st,3)) 


示例 5-14 ” 汉 诺 塔 问 题 基于 递归 算法 的 实现 。 

据说 古代 有 一 个 焚 塔 , 塔 内 有 3 个 底座 A、B、C,A 座 上 有 64 个 盘子 ,盘子 大 小 不 等 ， 
大 的 在 下 ,小 的 在 上 。 有 一 个 和 尚 想 把 这 64 个 盘子 从 A 座 移 到 C 座 , 但 每 次 只 能 允许 移 
动 一 个 盘子 ,在 移动 盘子 的 过 程 中 可 以 利用 B 座 ,但 任何 时 刻 3 个 座 上 的 盘子 都 必须 始 
终 保持 大 盘 在 下 、 小 盘 在 上 的 顺序 。 如 果 只 有 一 个 盘子 , 则 不 需要 利用 B 座 ,直接 将 盘子 
从 A 移动 到 C 即 可 。 和 尚 想 知 道 这 项 任务 的 详细 移动 步骤 和 顺序 。 这 实际 上 是 一 个 非 
常 巨大 的 工程 ,是 一 个 不 可 能 完成 的 任务 。 根 据 数 学 知识 我 们 可 以 知道 ,移动 n 个 盘子 需 
要 2" 一 1 步 ,64 个 盘子 需要 18 446 744 073 709 551 615 步 。 如 果 每 步 需 要 一 秒 ,那么 就 
需要 584 942 417 355. 072 年 。 


Gef hannoi (num src, dst., temp= None) : 
# 声 明 用 来 记录 移动 次 数 的 变量 为 全 局 变量 
global times 
# 确认 参数 类 型 和 范围 
assert type (num)== int, "num must be an integer'" 
assert num> 0, 'num mst> 0' 
# 只 剩 最 后 或 只 有 一 个 盘子 需要 移动 ,这 也 是 函数 递归 调用 的 结束 条 件 
if num==1: 
print ("The {0} Times move:{1}==> {2}'.format (times, src,dst)) 
times +=1 
else: 
# 递 归 调 用 函数 自身 
# 先 把 除 最 后 一 个 盘子 之 外 的 所 有 盘子 移动 到 临时 柱子 上 
hannoi (num- 1, src, terp, dst) 
# 把 最 后 一 个 盘子 直接 移动 到 目标 柱子 上 
hannoi (1, src,dst) 
# 把 除 最 后 一 个 盘子 之 外 的 其 他 盘子 从 临时 柱子 上 移动 到 目标 柱子 上 
hannoi (num- 1, tenp, dst, src) 
# 用 来 记录 移动 次 数 的 变量 
times=1 
#A 表 示 最 初 放置 盘子 的 柱子 ,c 是 目标 柱子 ,B 是 临时 柱子 
hannoi (3, 'A', 'C', 'B') 
示例 5-15 ”编写 函数 计算 任意 位 数 的 黑洞 数 。 黑 洞 数 是 指 这 样 的 整数 : 由 这 个 数字 
每 位 上 的 数字 组 成 的 最 大 数 减 去 每 位 数字 组 成 的 最 小 数 仍然 得 到 这 个 数 自身 。 例 如 ,3 
位 黑洞 数 是 495, 因 为 954 一 459 一 495,4 位 数字 是 6174 ,因为 7641 一 1467 一 6174。 


def main(n): 


"参数 n 表 示 数 字 的 位 数 , 例 如 =3 时 返回 495,n= 4 时 返回 6174'"' 
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# 待 测试 数 范围 的 起 点 和 结束 值 
start= 10xx (n- 1) 
end- 10exn 
# 依 次 测试 每 个 数 
for i in range (start,end): 
# 由 这 几 个 数字 组 成 的 最 大 数 和 最 小 数 
big= '' .join(sorted (str (i)vreverse= True)) 
little= ''.join (reversed (big)) 
big, little=map(int, (big, little)) 
if big- little==i: 
Print (i) 


main(n) 
示例 5-16 ”24 点 游戏 是 指 随机 选取 4 张 扑克 牌 (不 包括 大 小 王 ) ,然后 通过 四 则 运算 
来 构造 表达 式 ,如 果 表 达 式 的 值 恰 好 等 于 24 就 赢 一 次 。 下 面 的 代码 定义 了 一 个 函数 用 来 
测试 随机 给 定 的 4 个 数 是 否 符合 24 点 游戏 规则 ,如 果 符 合 就 输出 所 有 可 能 的 表达 式 。 


fram randcm import randint 
fram itertools import Permutations 


# 4 个 数字 和 2 个 运算 符 可 能 组 成 的 表达 式 形式 
exps= ('((%Ss%5s%5s) 要 3 和 3) 多 3 和 3 


"(3%s%s) Ss Ss%s%®s)', 
"sss (Ss%s$%s)) sss%s', 
'%s%s (Ss%Ss%s) Ss%s)', 
'S%Ss%s (人 sss (Ss%sss))') 


ops=r'+—#*/" 


def test24(v): 


result= [] 
# Python 允许 函数 的 嵌 套 定义 
# 这 个 函数 对 字符 串 表 达 式 求 值 并 验证 是 否 等 于 24 
Gef check (exp) : 
try: 
# 有 可 能 会 出 现 除 以 0 异常 ,所 以 放 到 异常 处 理 结构 中 
Teturn int (eval (exp))==24 
excoept: 
Teturn False 
# 全 排列 , 枚 举 4 个 数 的 所 有 可 能 顺序 
for a in penmtations (v) : 
# 查 找 4 个 数 的 当前 排列 能 实现 24 的 表达 式 
t= [exp $ (a[0],opl,a[l],op2,a[2],cop3,a[3]) for opl in ape for op?2 in ops for op3 in ops for exp 
in exps if check (exp % (a[0],cpl,a[ll],op2,a[2],op3,a[3]))] 
Ets 





result.append(t) 
retum result 


for i in range (20) : 
Print('="* 20) 
# 生 成 随机 数字 进行 测试 
lst= [randint (1,14) for j in range (4)] 
T= test24(1st) 
ifr: 
Print (r) 
else: 
Print ('No answer for ',1st) 
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示例 5-17 编写 函数 ,查找 序列 元 素 的 最 大 值 和 最 小 值 。 给 定 一 个 序列 ,返回 一 个 
元 组 ,其 中 元 组 第 一 个 元 素 为 序列 最 大 值 ,第 二 个 元 素 为 序列 最 小 值 。 


Gef myMaxMin (iterable) : 
"'"' 返 回 序列 的 最 大 值 和 最 小 值 '"" 
tMax= tMin= iterable[0] 
for item in iterable[1:]: 
证 item> tMax: 
tMax= item 
elif item tMin: 
tMin= item 


retum (tMax, tMin) 


示例 5-18 编写 函数 ,模拟 内 置 函 数 all() any() 和 zip() 。 


def myAll (iterable) : 
"模拟 内 置 函 数 al0'"' 
# 只 要 有 一 个 元 素 等 价 于 False, 返 回 False 
for item in iterable: 
if not item: 
Teturn False 
# 如 果 所 有 元 素 都 等 价 于 True, 返 回 True 


retum True 


def myAny (iterable) : 
"" 噶 拟 内 置 函 数 any0'"' 
# 只 要 有 一 个 元 素 等 价 于 True, 返 回 True 
for item in iterable: 
if item: 
Ietum True 
# 如 果 所 有 元 素 都 等 价 于 False, 返 回 False 


Teturn False 
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aef myZip(* iterables) : 
"模拟 内 置 函 数 zip0'"' 
# 获 取 所 有 和 迭代 对 象 的 最 小 长 度 
min length= min (map (len,iterables)) 


# 依 次 返回 所 有 迭代 对 象 中 对 应 位 置 上 元 素 组 成 的 元 组 
for i in range (min length) : 
yield tuple((it[i] for it in iterables)) 
示例 5-19 ”编写 函数 ,使 用 非 递归 算法 实现 冒 泡 排序 算法 。 


fram randem import randint 


Gef bubbleSort (1st, reverse= False) : 
Jengt len (1st) 
for i in range (0, length) : 
flag- False 
for j in range(0,length- i— 1): 
# 比 较 相 邻 两 个 元 素 大 小 ,并 根据 需要 进行 交换 
# 默 认 升序 排列 
er "lstD]> 1st D+ 1]" 
# 如 果 reverse=True 则 降序 排列 
if reverse: 
er "lstD]< 1st 0+1]" 
if eval (exp): 
1st[j],1st[j+ 1]=1st[j+1],1st[j] 
#flag=True 表 示 本 次 扫描 发 生 过 元 素 交换 
日 asg= True 
# 如 果 一 次 扫描 结束 后 ,没有 发 生 过 元 素 交 换 ,说 明 已 经 按 序 排列 
if not flag: 
break 


1st= [randint (1, 100) for i in range (20)] 
print ('Before sort:\n', 1st) 
bubblesort (1st, True) 

print ('After sort:\n',1st) 


示例 5-20 编写 函数 ,使 用 递归 算法 实现 冒 泡 排 序 算法 。 


fram randem import randint 


Gef bubbleSort (lst,end None, reverse— False) : 
if end= = None: 
lengthr len (1st) 
else: 
Jength= end 
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if length<=1: 
Teturn 
# flag 用 来 标记 本 次 扫描 过 程 中 是 否 发 生 了 元 素 的 交换 
flag- False 
for j in range (length— 1): 
# 比较 相 邻 两 个 元 素 的 大 小 ,并 根据 需要 进行 交换 
# 默 认 升 序 排列 
er "1st Dj]> 1st[j+ 1]" 
# 如 果 reverse= True 则 降序 排列 
if reverse: 
er "1st[j]< 1stD+1]" 
if eval (exp): 
1st[j],1st[j+1]=1st[j+ 1],1st[j] 
flag- True 
# 如 果 没 有 发 生 元 素 交 换 , 则 表示 已 按 序 排列 
if flag-=False: 
retum 
else: 
# 对 剩余 的 元 素 进行 排序 
bukbbleSort (lst, length- 1, reverse) 


# 测 试 

lst= [randint (1, 100) for i in range(20)] 
Print ('Before sorted:\n',1st) 

# 升 序 排列 

buhblesort (1st) 

# 降 序 排列 

# bubbleSort (lst, reverse= True) 

Print ('After sorted:\n',1st) 


示例 5-21 编写 函数 ,模拟 选择 法 排序 。 


Gef selectSort (lst, reverse= False) : 
length= len (1st) 
for i in range (0, length): 
# 假 设 剩余 元 素 中 第 一 个 最 小 或 最 大 
mi 
# 扫 描 剩 余 元 素 
for j in range (i+ 1, length): 
# 如 果 有 更 小 或 更 大 的 ,就 记录 下 它 的 位 置 
er "1st Dj]<1stm]" 
if reverse: 
er "1st 0]> 1sttm]" 
证 eval (exp): 
wj 


# 如 果 发 现 更 小 或 更 大 的 ,就 交换 值 
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if ml=i: 
1st[i],1stfml= 1stfm],1st[i] 


示例 5-22 编写 函数 ,模拟 二 分 法 查找 。 

二 分 法 查找 算法 非常 适合 在 大 量 元 素 中 查找 指定 的 元 素 ,要 求 序列 已 经 排 好 序 ( 这 里 
假设 按 从 小 到 大 排序 ) ,首先 测试 中 间 位 置 上 的 元 素 是 否 为 想 查 找 的 元 素 , 如 果 是 则 结束 
算法 ;如 果 序 列 中 间 位 置 上 的 元 素 比 要 查找 的 元 素 小 , 则 在 序列 的 后 面 一 半 元 素 中 继续 查 
找 ; 如 果 中 间 位 置 上 的 元 素 比 要 查找 的 元 素 大 , 则 在 序列 的 前 面 一 半 元 素 中 继续 查找 。 重 
复 上 面 的 过 程 ,不 断 地 缩小 搜索 范围 ,直到 查找 成 功 或 者 失败 (要 查找 的 元 素 不 在 序 
列 中 ) 。 


Gef binarySearch (1st,value) : 
start=0 
end= len (lst) 
while start< end: 
# 计 算 中 间 位 置 
middle= (start +end) // 2 
# 查 找 成 功 , 返 回 元 素 对 应 的 位 置 
if value== lst [middle]: 
Teturn middle 
# 在 后 面 一 半 元 素 中 继续 查找 
elif value> lst [middle]: 
start=middle +1 
# 在 前 面 一 半 元 素 中 继续 查找 
elif value< lst [middle]: 
end-migdle -1 
# 查 找 不 成 功 , 返 回 False 
retum False 
fram randcm import randint 


lst= [randint (1, 50) for i in range (20)] 
lst.sort() 
Print (1st) 
result= binarySearch (1st, 30) 
if result !=False: 
Print ('Sucoess, its position is:'",result) 
else: 
print ('Fail. Not exist.') 
标准 库 bisect 实现 了 二 分 法 查找 和 插入 的 有 关 功 能 ,其 中 的 bisect_left() 和 
bisect_right() 方 法 可 以 用 来 定位 在 一 个 有 序列 表 中 插入 指定 元 素 而 保持 新 列表 有 序 的 
正确 位 置 , 如 果 原 列表 中 已 存在 要 插入 的 元 素 , 那 么 bisect_left() 返 回 已 有 元 素 前 面 紧邻 
的 位 置 ,而 bisect_right() 返 回 已 有 元 素 后 面 紧邻 的 位 置 ;insort_left() 和 insort_right() 则 
直接 在 正确 的 位 置 插入 新 元 素 并 且 保 持 新 列表 有 序 。 
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>>> import bisect 

>>> 1st= list (range (10)) # 创 建 列 表 

>>> 1st 

[0,1,2,3,4,5,6,7,8,9] 

>>>bisect.bisect left (lst,5) # 获 取 需 要 插入 的 新 元 素 的 正确 位 置 


5 
>>> bisect.bisect right (lst,5) 

6 

>>>bisect.bisect left (lst,5.5) 

6 

>>> bisect.bisect right (lst,5.5) 

6 

>>> lst.insert (6,5.5) # 插 入 新 元 素 
>>> bisect.insort left (lst,7.9) # 插 入 新 元 素 
>>> lst 

[0,1,2,3,4,5,5.5,6,7,7.9,8,9] 


示例 5-23 编写 函数 ,模拟 快速 排序 算法 。 


fram randcm import randint 


Gef quickSort (lst, reverse= False) : 
if len(lst) <=1: 
retum lst 
# 默 认 使 用 最 后 一 个 元 素 作为 枢 点 
Pivot= lst.pop() 
first,second= [], [] 
# 默 认 使 用 升序 排列 
er 'x<=pivot' 
#reverse- True 表示 降序 排列 
if reverse==True: 
expr "> =pivot' 
for x in lst: 
first .append (x) if eval (exp) else seoond.append (x) 
# 递 归 调 用 
retum quickSort (first, reverse) + [pivot] + quickSort (second, reverse) 


lst= [randint (1, 1000) for i in range(10)] 
Print (quickSort (1st, True)) 


上 面 的 代码 思路 非常 清晰 ,不 过 空间 开销 比较 大 .如 果 使 用 经 典 的 快速 排序 算法 , 代 
人 码 可 以 这 样 写 : 
def quickSort (x, start,end) : 


if start >=end: 
retum 
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这 start 

end 

# 使 用 第 一 个 元 素 作为 枢 点 
key=x[start] 


while i<j: 
# 从 后 向 前 寻找 第 一 个 比 指定 元 素 小 的 元 素 
while i<j and x[j]>= key: 
j-=1 
x[i]=x[j] 


# 从 前 向 后 寻找 第 一 个 比 指定 元 素 大 的 元 素 
while i<j and x[i]<=key: 
it=1 


x0]=x[i] 


x[i]=key 
quicksort (x, start, i— 1) 
quicksort (x,i+ 1,end) 


示例 5-24 ”编写 函数 ,实现 归并 排序 算法 ,并 进行 测试 。 
import randcm 


Gef mergeSort (seq, reverse= False) : 
# 把 原 列表 分 成 两 部 分 
mid- len (seg) // 2 
left, right= seq[:mid], seqlmid:] 


# 根 据 需要 进行 递归 
if len(left)>1: 

1left= mergesort (left) 
if len(right)> 1: 

Tight— mergeSort (right) 


# 现 在 前 后 两 部 分 都 已 排序 
# 进 行 合并 
tamp= [] 
while left and right: 
if left[-1] >=right[- 1]: 
tenp.append (left .pop()) 
else: 
tenp.append (right .pop()) 
temp.reverse() 
result= (left or right) + temp 
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# 根 据 需要 进行 逆序 
if reverse: 
j=0,len(result)-1 
while i<j: 
Tesult [i],result DG]= result[j],result[i] 
计 =1 
于 =1 
retumn result 


for i in range (100000) : 
# 生 成 随机 测试 数据 
Teverser Iandcom.choice( (True, False)) 
= [randcm.randint (1, 100) for i in range(20)] 
sorted (x, reverse= reverse) 
X= mergeSort (x, reverse) 
if x!l=y: 
Print ('error') 


示例 5-25 编写 函数 ,查找 给 定 序列 的 最 长 递增 子 序列 。 


fram itertools import ombinations 
fram randcm import sanple 


Gef subascendingList (1st): 
"'"' 返 回 最 长 递增 子 序列 '"' 
for length in range (len(1st),0,- 1): 
# 按 长 度 递减 的 顺序 进行 查找 和 判断 
for sub in ombinations (lst, length): 
# 判 断 当 前 选择 的 子 序列 是 否 为 递增 顺序 
if list (sub)== sorted(sub) : 
# 找 到 第 一 个 就 返回 


retum sub 


def getList (start= 0,endF 1000, nuniber= 20) : 
"生成 随机 序列 '"" 
if number> end- start: 
retum None 
retum sample (range (start,end) ,nunber) 


def main(): 
1st= getList (nurber= 10) 
if lst: 
Print (1st) 
Print (stbAsosndingList (1st)) 
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属 
示例 5-26 ”编写 函数 ,寻找 给 定 序列 中 相差 最 小 的 两 个 数字 。 


import random 


def getTwoClosestElements (seq) : 

# 先 进行 排序 ,使 得 相 邻 元 素 最 接近 
# 相 差 最 小 的 元 素 必 然 相 邻 
seqFr sorted (seq) 
# 无 穷 大 
dif= float('inf') 
# 遍 历 所 有 元 素 ,两 两 比较 ,比较 相 邻 元 素 的 差 值 
# 使 用 选择 法 寻找 相差 最 小 的 两 个 元 素 
for i,v in enumerate (seq[:- 1]): 

和 abs(v - seq[i+ 1]) 

if ddif: 

first, seoond,dif=v, seq[i+ 1],d 

# 返 回 相差 最 小 的 两 个 元 素 
retum (first, second) 


seq= [randcm.randcm() for i in range(20)] 
Print (seg) 

Print (sorted (seqg) ) 

print (getTwoClosestElements (3eq) ) 


示例 5-27 编写 函数 ,使 用 筛选 法 求解 小 于 指定 整数 的 所 有 素数 。 


def primes (maxNunber) : 

"筛选 法 获取 小 于 maxNunber 的 所 有 素数 '"'' 
# 待 判断 整数 
lst= list (range (3,mexNunber, 2)) 
# 最 大 整数 的 平方 根 
me int (maxNunmber** 0.5) 
for index in range (m): 

Current= lst [index] 

# 如 果 当 前 数字 已 大 于 最 大 整数 的 平方 根 , 结 束 判断 

if current>m: 

break 

# 对 该 位 置 之 后 的 元 素 进行 过 滤 

Jst[index+ 1:]= list (filter (lanbda x: x% current!=0,1st [indext 1:])) 
#2 也 是 素数 


retumn [2] +lst 


Print (orimes (1000)) 
示例 5-28 ”模拟 整数 乘法 的 小 学 竖 式 计算 方法 。 
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"小 学 整数 乘法 竖 式 计算 示例 


fram randcm import randint 


Gef ml (ab) : 
"小 学 竖 式 两 个 整数 相 乘 的 算法 实现 '" 
# 把 两 个 整数 分 离开 成 为 各 位 数字 再 逆序 
aar list (map (int, reversed (str (a)))) 
bbr list (nap (int, reversed (str (po)))) 


#n 位 整数 和 m 位 整数 的 乘积 最 多 是 ntm 位 整数 
result= [0]* (len (aa)+ len (cb)) 


# 按 小 学 整数 乘法 竖 式 计算 两 个 整数 的 乘积 
for ia,va in enumerate (aa) : 
#c 表 示 进 位 ,初始 为 0 
=0 
for ib,vb in enumerate (bb) : 
# Python 中 内 置 函数 demd(0 可 以 同时 计算 整 商 和 余数 
crresult[ija+ ib]= divmpd(vax vbt ct result[ia+ ib],10) 
# 最 高 位 的 余数 应 进 到 更 高 位 
result [iat ibt 1]=c 


# 整 理 , 变 成 正常 结果 
result= int ('' .join (map (str, reversed (result)))) 
retum result 


# 测 试 
for i in range (100000) : 
a randint (1, 1000) 
b= randint (1, 1000) 
ml (arb) 
ifr l=-axb: 
Print (a,b,r, 'error') 


示例 5-29 编写 函数 ,模拟 轮 盘 抽奖 游戏 。 
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轮 盘 抽奖 是 比较 常见 的 一 种 游戏 ,在 轮 盘 上 有 一 个 指针 和 一 些 不 同 颜色 \ 不 同 面积 的 
扇形 ,用力 转动 轮 盘 , 轮 盘 慢 慢 停 下 后 依靠 指针 所 处 的 位 置 来 判定 是 否 中 奖 以 及 奖项 等 
级 。 本 例 中 的 函数 名 和 很 多 变量 名 使 用 了 中 文 , 这 在 Python 3.x 中 是 完全 人 允许 的 。 





fram randem import randem 


def 轮 盘 赌 奖项 分 布 ): 
本 次 转盘 读数 = ranqcm() 
for kiv in 奖项 分 布 .items(): 
if v[0]<= 本 次 转盘 读数 <v[1]: 
Teturn k 
# 各 奖项 在 轮 盘 上 所 占 比 例 
奖项 分 布 ={" 一 等 奖 ':(0,0.08)， 
' 二 等 奖 ': (0.08,0.3)， 
(三 等 奖 ':(0.3,1.0)} 


中 奖 情况 =dict() 
for i in range (10000) : 
本 次 战况 = 轮 盘 赌 奖项 分 布 ) 
中 奖 情况 [本 次 战况 ]= 中 奖 情况 .get 本 次 战况 ,0) +1 


for item in 中 奖 情况 .items(): 


Print (item) 
本 章 小 结 
(1) 应 尽量 减少 使 用 直接 复制 代码 的 方式 来 实现 复 用 ,而 是 把 需要 重复 使 用 的 代码 


(2) 定义 函数 时 不 需要 指定 参数 类 型 。 

(3) 定义 函数 时 不 需要 指定 函数 的 返回 值 类 型 ,而 是 由 return 语句 返回 的 值 的 类 型 
来 决定 。 

(4) 在 函数 中 ,如 果 没 有 return 语句 ,或 者 有 return 语句 但 是 没有 返回 任何 值 ,或 者 
有 return 语句 但 是 没有 执行 到 , 则 函数 返回 空 值 None。 

(5) 在 Python 中 ,可 以 嵌 套 定义 函数 。 

(6) 在 Python 中 ,函数 参数 有 普通 位 置 参 数 、 默 认 值 参数 、 关 键 参 数 和 可 变 长 度 参数 
等 几 种 类 型 。 

(7) 函数 内 的 局 部 变量 在 函数 执行 结束 后 会 自动 释放 而 不 可 再 访问 。 

(8) lambda 表达 式 常 用 来 定义 匿名 函数 ,也 可 以 定义 具名 函数 。 

(9) 包含 yield 语句 的 函数 称 为 生成 器 函数 ,其 返回 值 是 一 个 具有 惰性 求 值 特点 的 生 
成 器 对 象 。 
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习 题 


5.1 在 函数 内 部 可 以 通过 关键 字 来 定义 全 局 变量 。 

5.2 编写 函数 ,判断 一 个 整数 是 否 为 素数 ,并 编写 主 程序 调用 该 函数 。 

5.3 编写 函数 ,接收 一 个 字符 串 , 分 别 统计 大 写字 母 , 小 写字 母 数字、 其 他 字符 的 个 
数 ,并 以 元 组 的 形式 返回 结果 。 

5.4 ”如 果 函 数 中 没有 return 语句 或 者 return 语句 不 带 任何 返回 值 ,那么 该 函数 的 
返回 值 为 

5.5 判断 题 : 调用 带 有 默认 值 参数 的 函数 时 ,不 能 为 默认 值 参数 传递 任何 值 , 必 须 
使 用 函数 定义 时 设置 的 默认 值 。 

5.6 在 Python 程序 中 ,局 部 变量 会 隐藏 同名 的 全 局 变量 吗 ? 请 编写 代码 进行 

5.7 判断 题 : lambda 表达 式 只 能 用 来 创建 匿名 函数 ,不 能 为 这 样 的 函数 起 名 字 。 

5.8 编写 函数 ,可 以 接收 任意 多 个 整数 并 输出 其 中 的 最 大 值 和 所 有 整数 之 和 。 

5.9 编写 函数 ,模拟 内 园 函 数 sum()。 

5.10 包含 语句 的 函数 可 以 用 来 创建 生成 器 对 象 。 

5.11 编写 函数 ,模拟 内 置 函 数 sorted()。 

5.12 编写 函数 ,模拟 内 置 函 数 reversed()。 
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属 代码 复 用 技术 (二 ) : 面向 对 象 
”程序 设计 





面向 对 象 程序 设计 (Object Oriented Programming,OOP) 的 思想 主要 针对 大 型 软件 
设计 提出 的 ,使 得 软件 设计 更 加 灵活 ,能够 很 好 地 支持 代码 复 用 和 设计 复 用 ,代码 具有 更 
好 的 可 读 性 和 可 扩展 性 ,大 幅度 降低 了 软件 开发 的 难度 。 面 向 对 象 程序 设计 的 一 个 关键 
性 观念 是 将 数据 以 及 对 数据 的 操作 封装 在 一 起 ,组 成 一 个 相互 依存 不 可 分 割 的 整体 (对 
象 ) ,不 同 对 象 之 间 通 过 消息 机 制 来 通信 或 者 同步 。 对 于 相同 类 型 的 对 象 (instance) 进 行 
分 类 、 抽 象 后 ,得 出 共同 的 特征 而 形成 了 类 (class) ,面向 对 象 程序 设计 的 关键 就 是 如 何 合 
理 地 定义 这 些 类 并 且 组 织 多 个 类 之 间 的 关系 。 

Python 是 面向 对 象 的 解释 型 高 级 动态 编程 语言 ,完全 支持 面向 对 象 的 基本 功能 ,如 
封装 、 继 承 、 多 态 以 及 对 基 类 方法 的 覆盖 或 重 写 。 创 建 类 时 用 变量 形式 表示 对 象 特征 的 成 
员 称 为 数据 成 员 (attribute) ,用 函数 形式 表示 对 象 行为 的 成 员 称 为 成 员 方 法 (method) , 数 
据 成 员 和 成 员 方法 统称 为 类 的 成 员 。 需要 注意 的 是 , Python 中 对 象 的 概念 很 广泛 ， 
Python 中 的 一 切 内容 都 可 以 称 为 对 象 ,函数 也 是 对 象 .类 也 是 对 象 。 


6.1 类 的 定义 与 使 用 


Python 使 用 class 关键 字 来 定义 类 ,class 关键 字 之 后 是 一 个 空格 , 接 下 来 是 类 的 名 
字 , 如 果 派生 自 其 他 基 类 则 需要 把 所 有 基 类 放 到 一 对 括号 中 并 使 用 逗号 分 隔 , 然 后 是 一 个 
冒号 ,最 后 换行 并 定义 类 的 内 部 实现 。 类 名 的 首 字 母 一 般 要 大 写 ,当然 也 可 以 按照 自己 的 
习惯 定义 类 名 ,但 一 般 推 荐 参考 惯例 来 命名 ,并 在 整个 系统 的 设计 和 实现 中 保持 风格 一 
致 ,这 一 点 对 于 团队 合作 非常 重要 。 

class Car (cbject) : # 定 义 一 个 类 ,派生 自 cpject 类 

def infor (self) : # 定 义 成 员 方 法 
print ("Ihis is a car") 

定义 了 类 之 后 ,就 可 以 用 来 实例 化 对 象 ,并 通过 “对 象 名 . 成 员 ” 的 方式 来 访问 其 中 的 
数据 成 员 或 成 员 方 法 。 

>>> car=Car() # 实 例 化 对 象 


>>> car.infor() # 调 用 对 象 的 成 员 方法 
This is a car 
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在 Python 中 ,可 以 使 用 内 置 函 数 isinstance() 来 测试 一 个 对 象 是 否 为 某 个 类 的 实例 ， 
或 者 使 用 内 置 函 数 type() 查 看 对 象 类 型 。 

>>> isinstance (car,Car) 

True 

>>> isinstance (car, str) 

False 

>>> type (car) 

<class' min _.Car'> 

Python 提供 了 一 个 关键 字 pass, 执 行 时 什么 也 不 会 发 生 , 可 以 用 在 类 和 函数 的 定义 
中 或 者 选择 结构 中 ,表示 空 语句 。 如 果 和 暂时 没有 确定 如 何 实现 某 个 功能 ,或 者 提前 为 以 后 
的 软件 升级 预 留 一 点 空间 ,可 以 使 用 关键 字 pass 来 “ 占 位 ”。 

和 定义 函数 一 样 ,在 定义 类 时 ,也 可 以 使 用 三 引号 为 类 进行 必要 的 注释 。 

>>> class Test: 

his is only a test.'"" 


pass 
>>> Test. _doc # 查 看 类 的 帮助 文档 


"This is only a test.' 


6.2 数据 成 员 与 成 员 方 法 


621 私有 成 员 与 公有 成 员 


私有 成 员 在 类 的 外 部 不 能 直接 访问 ,一 般 是 在 类 的 内 部 进行 访问 和 操作 ,或 者 在 类 的 
外 部 通过 调用 对 象 的 公有 成 员 方法 来 访问 ,而 公有 成 员 是 可 以 公开 使 用 的 , 既 可 以 在 类 的 
内 部 进行 访问 ,也 可 以 在 外 部 程序 中 使 用 。 

从 形式 上 看 ,在 定义 类 的 成 员 时 ,如 果 成 员 名 以 两 个 (或 更 多 ) 下 夯 线 开头 但 是 不 以 两 
个 (或 更 多 ) 下 夯 线 结束 则 表示 是 私有 成 员 ,否则 就 不 是 私有 成 员 。Python 并 没有 对 私有 
成 员 提供 严格 的 访问 保护 机 制 ,通过 一 种 特殊 方式 “对 象 名 ._ 类 名 _xxx" 也 可 以 在 外 部 
程序 中 访问 私有 成 员 ,但 这 会 破坏 类 的 封装 性 ,不 建议 这 样 做 。 


>>> class R: 
def 。_ init _ (self,valuel=0,value20): # 构 造 方法 
Self. valuel= valuel 
self. _value2- value2 # 私 有 成 员 
def setValue (self,valuel,value?) : # 成 员 方 法 ,公有 成 员 
self. valuel=valuel 
self. _value2- value2 # 在 类 内 部 可 以 直接 访问 私有 成 员 
def show(self) : # 成 员 方法 ,公有 成 员 


print (self. valuel) 
print (self. value2) 
>>> 二 有 () 
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>>>a. valuel # 在 类 外 部 可 以 直接 访问 非 私有 成 员 
0 


>>>a. A _value? # 在 类 外 部 访问 对 象 的 私有 数据 成 员 
0 


圆 点 “. ”是 成 员 访 问 运算 符 , 可 以 用 来 访问 命名 空间 、 模 块 或 对 象 中 的 成 员 , 在 
IDLE、Eclipse 十 PyDev、WingIDE、PyCharm 或 其 他 Python 开发 环境 中 ,在 对 象 或 类 名 后 
面 加 上 一 个 圆 点 *.”, 都 会 自动 列 出 其 所 有 公开 成 员 , 如 图 6-1 所 示 。 而 如 果 在 圆 点 “. ”后 
面 再 加 一 个 下 画 线 , 则 会 列 出 该 对 象 或 类 的 所 有 成 员 ,包括 私有 成 员 , 如 图 6-2 所 示 。 当 
然 ,也 可 以 使 用 内 置 函 数 dir() 来 查看 指定 对 象 . 模 块 或 命名 空间 的 所 有 成 员 。 





图 6-1 列 出 对 象 公开 成 员 图 6-2 列 出 对 象 所 有 成 员 


在 Python 中 ,以 下 画 线 开 头 或 结束 的 成 员 名 有 特殊 的 含义 ,在 类 的 定义 中 用 下 画 线 
作为 成 员 名 前 级 和 后 绥 往 往 是 表示 类 的 特殊 成 员 。 

(1) _xxx: 以 一 个 下 画 线 开头 ,保护 成 员 , 只 有 类 对 象 和 子 类 对 象 可 以 访问 这 些 成 
员 ,在 类 的 外 部 一 般 不 建议 直接 访问 ;在 模块 中 使 用 一 个 或 多 个 下 画 线 开头 的 成 员 不 能 用 
from module import * 导入 ,除非 在 模块 中 使 用 _all_ 变量 明确 指明 这 样 的 成 员 可 以 被 
导入 。 

(2) __xxx__: 前 后 各 两 个 下 画 线 ,系统 定义 的 特殊 成 员 。 

(3) _xxx: 以 两 个 或 更 多 下 画 线 开头 但 不 以 两 个 或 更 多 下 画 线 结束 ,表示 私有 成 
员 ,一 般 只 有 类 对 象 自己 能 访问 , 子 类 对 象 也 不 能 访问 该 成 员 ,但 在 对 象 外 部 可 以 通过 “对 
象 名 ._ 类 名 __xxx” 这 样 的 特殊 方式 来 访问 。 


622 数据 成 员 


数据 成 员 可 以 大 致 分 为 两 类 : 属于 对 象 的 数据 成 员 和 属于 类 的 数据 成 员 。 属 于 对 象 
的 数据 成 员 一 般 在 构造 方法 _init _() 中 定义 ,当然 也 可 以 在 其 他 成 员 方法 中 定义 ,在 定 
义 和 在 实例 方法 中 访问 数据 成 员 时 以 self 作为 前 缀 ,同一 个 类 的 不 同 对 象 (实例 ) 的 数据 
成 员 之 间 互 不 影响 :属于 类 的 数据 成 员 是 该 类 所 有 对 象 共享 的 ,不 属于 任何 一 个 对 象 ,在 
定义 类 时 这 类 数据 成 员 一 般 不 在 任何 一 个 成 员 方法 的 定义 中 。 在 主 程序 中 或 类 的 外 部 ， 
对 象 数据 成 员 属于 实例 (对 象 ) ,只 能 通过 对 象 名 访问 ;而 类 数据 成 员 属于 类 ,可 以 通过 类 
名 或 对 象 名 访问 。 

利用 类 数据 成 员 的 共享 性 ,可 以 实时 获得 该 类 的 对 象 数量 ,并 且 可 以 控制 该 类 创建 的 
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对 象 最 大 数量 。 例 如 


>>> class Dam (cbject) : 


total=0 
def __new _(cls,*args x*kwargs): # 该 方法 在 。_init _() 之 前 被 调用 
if cls.total >=3: # 最 多 允许 创建 3 个 对 象 
raise Excepticn (最 多 只 能 创建 3 个 对 象 ') 
else: 


retum cbject. new _(cls) 
def init (self): 

Demp.total= Demp.total +1 
>>>tl= Demp() 
>>>t1l 
<_ _min _.Dem cbject at 0x00000000034R0278> 
>>>t2= Demp () 
>>>t3 Demp () 
>>>t4 Demp() 
Exosption: 最 多 只 能 创建 3 个 对 象 
>>>t4 
NameError: name 't4' is not defined 


623 成 员 方 法 、 类 方法 、 静 态 方法 、 抽 象 方法 


首先 应 该 明确 ,在 面向 对 象 程序 设计 中 ,函数 和 方法 这 两 个 概念 是 有 本 质 区 别 的 。 方 
法 一 般 指 与 特定 实例 绑 定 的 函数 ,通过 对 象 调 用 方法 时 ,对 象 本 身 将 被 作为 第 一 个 参数 自 
动 传递 过 去 ,普通 函数 并 不 具备 这 个 特点 。 例 如 ,内 置 函 数 sorted() 必 须要 指明 要 排序 的 
对 象 ,而 列表 对 象 的 sort() 方 法 则 不 需要 ,默认 是 对 当前 列表 进行 排序 。 


>>> class Demp: 
pass 
>>>t=Demw() 
>>> def test(selfvv) : 
self.value=V 
>>>t.test= test # 动 态 增加 普通 函数 
>>>t.test 
< finction test at Qx00000000034B7EAO> 
>>>t.test (t,3) # 需 要 为 self 传 递 参数 
>>>print (t.value) 
3 
>>> import types 
>>> t.test— types.MEthodrype (test,t) # 动 态 增加 绑 定 的 方法 
>>>t.test 
<bound method test of < _main _.Demo cbject at 0x000000000074F9E8>> 
>>>t.test (5) # 不 需要 为 self 传 递 参数 


= 如 
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>>> print (t.value) 

5 

Python 类 的 成 员 方 法 大 致 可 以 分 为 公有 方法 、 私 有 方法 ,静态 方法 、 类 方法 和 抽象 方 
法 这 几 种 类 型 。 公 有 方法 、 私 有 方法 和 抽象 方法 一 般 是 指 属 于 对 象 的 实例 方法 ,私有 方法 
的 名 字 以 两 个 或 更 多 个 下 画 线 开始 ,而 抽象 方法 一 般 定 义 在 抽象 类 中 并 且 要 求 派 生 类 必 
须 重 新 实现 。 每 个 对 象 都 有 自己 的 公有 方法 和 私有 方法 ,在 这 两 类 方法 中 都 可 以 访问 属 
于 类 和 对 象 的 成 员 。 公 有 方法 通过 对 象 名 直接 调用 ,私有 方法 不 能 通过 对 象 名 直接 调用 ， 
只 能 在 其 他 实例 方法 中 通过 前 绥 self 进行 调用 或 在 外 部 通过 特殊 的 形式 来 调用 。 另 外 ， 
Python 中 的 类 还 支持 大 量 的 特殊 方法 ,这 些 方法 的 两 侧 各 有 两 个 下 画 线 (__) ,往往 与 某 
个 运算 符 或 内 吐 函 数 相对 应 。 

所 有 实例 方法 (包括 公有 方法 .私有 方法 .抽象 方 法 和 某 些 特殊 方法 ) 都 必须 至 少 有 一 
个 名 为 self 的 参数 ,并 且 必 须 是 方法 的 第 一 个 形 参 ( 如 果 有 多 个 形 参 的 话 ) ,self 参数 代表 
当前 对 象 。 在 实例 方法 中 访问 实例 成 员 时 需要 以 self 为 前 级 ,但 在 外 部 通过 对 象 名 调用 
对 象 方法 时 并 不 需要 传递 这 个 参数 。 如 果 在 外 部 通过 类 名 调用 属于 对 象 的 公有 方法 , 需 
要 显 式 为 该 方法 的 self 参数 传递 一 个 对 象 名 ,用 来 明确 指定 访问 哪个 对 象 的 成 员 。 

静态 方法 和 类 方法 都 可 以 通过 类 名 和 对 象 名 调用 ,但 不 能 直接 访问 属于 对 象 的 成 员 ， 
只 能 访问 属于 类 的 成 员 。 另 外 ,静态 方法 和 类 方法 不 属于 任何 实例 ,不 会 绑 定 到 任何 实 
例 ,当然 也 不 依赖 于 任何 实例 的 状态 ,与 实例 方法 相 比 能 够 减少 很 多 开销 。 类 方法 一 般 以 
cls 作为 第 一 个 参数 表示 该 类 自身 ,在 调用 类 方法 时 不 需要 为 该 参数 传递 值 ,静态 方法 则 
可 以 不 接收 任何 参数 。 

>>> class Foot: 

total=0 


def __init _(self,v): 
self. value=v 


Root. _total +=1 


# 构 造 方 法 ,特殊 方法 


Gef show(self) : # 普 通 实例 方法 一 般 以 self 作 为 第 一 个 参数 的 名 字 
print('self. _value:',self. _value) 
print('Root. _total:',Root. _total) 


Print (Root。 _ total) 
>>> 天 Root (3) 
>>>r.classShowTotal () 
1 


# 修 饰 器 ,声明 类 方法 
# 类 方法 一般 以 cls 作 为 第 一 个 参数 的 名 字 


# 修 饰 器 ,声明 静态 方法 
# 静 态 方法 ,可 以 没有 参数 


# 通 过 对 象 来 调用 类 方法 
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>>> r.staticshowTotal () # 通 过 对 象 来 调用 静态 方法 
1 
>>> IERoot (5) 


>>> Root.classShowrotal () # 通 过 类 名 调用 类 方法 

2 

>>> Root.staticshowTotal () # 通 过 类 名 调用 静态 方法 

>>> Root.show() # 试 图 通过 类 名 直接 调用 实例 方法 ,失败 
TYpeError: unbound method show () mst be called with Root instance as first argument (got nothing 
instead) 

>>> Root.show (r) # 可 以 通过 这 种 方法 来 调用 方法 并 访问 实例 成 员 


Self. value: 3 

Root. _ total: 2 

抽象 方法 一 般 在 抽象 类 中 定义 ,并 且 要 求 在 派生 类 中 必须 重新 实现 ,否则 不 允许 派生 
类 创建 实例 。 


import abc 
class Foo (metaclass= abc.ABCMeta) : # 抽 象 类 
def fl (self) : # 普 通 实例 方法 
Print (123) 
def f2 (self) : # 普 通 实例 方法 
Print (456) 
@ abc.abstractmethod # 抽 象 方法 
ef f3(self): 
raise Exception ('You must reimplement this method.') 
class Bar (Foo) : 
def f3 (self) : # 必 须 重新 实现 基 类 中 的 抽象 方法 
Print (33333) 
b=Bar() 
b.£3() 
624 属性 


公开 的 数据 成 员 可 以 在 外 部 随意 访问 和 修改 ,很 难保 证 用 户 进 行 修改 时 提供 新 数据 
的 合法 性 ,数据 很 容易 被 破坏 ,也 不 符合 类 的 封装 性 要 求 。 解 决 这 一 问题 的 常用 方法 是 定 
义 私 有 数据 成 员 ,然后 设计 公开 的 成 员 方 法 来 提供 对 私有 数据 成 员 的 读 取 和 修改 操作 , 修 
改 私有 数据 成 员 之 前 可 以 对 值 进行 合法 性 检查 ,提高 了 程序 的 健壮 性 ,保证 了 数据 的 完整 
性 。 属 性 (property) 是 一 种 特殊 形式 的 成 员 方 法 ,结合 了 公开 数据 成 员 和 成 员 方 法 的 优 
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点 , 既 可 以 像 成 员 方 法 那样 对 值 进行 必要 的 检查 ,又 可 以 像 数 据 成 员 一 样 灵 活 地 访问 。 

在 Python 3.x 中 ,属性 得 到 了 较为 完整 的 实现 ,支持 更 加 全 面 的 保护 机 制 。 如 果 设 
置 属 性 为 只 读 , 则 无 法 修改 其 值 ,也 无 法 为 对 象 增加 与 属性 同名 的 新 成 员 , 当然 也 无 法 删 
除 对 象 属性 。 例 如 : 


>>> class Test: 
def__init _(self,value): 


self. _value=value # 私 有 数据 成 员 
8@Property # 修 饰 器 ,定义 属性 ,提供 对 私有 数据 成 员 的 访问 
def value (se1f) : # 只 读 属 性 ,无 法 修改 和 删除 
retum self. value 
>>>t=Test(3) 
>>>t.value 
3 
>>>t.value=5 # 只 读 属性 不 允许 修改 值 
Attributeprror: can't set attribute 
>>> del t.value # 试 图 删除 对 象 属性 ,失败 
Attributegrror: can't delete attribute 
>>>t.value 


3 
下 面 的 代码 则 把 属性 设置 为 可 读 、 可 修改 ,而 不 允许 删除 。 


>>> class Test: 
def init _(self,value): 
self. _value=value 


def _ _get (self) : # 读 取 私有 数据 成 员 的 值 
retum self. _value 


def _ _set(self,v): # 修 改 私 有 数据 成 员 的 值 
self. value=v 


value=property( _get, _set) # 可 读 可 写 属性 ,指定 相应 的 读 写 方法 
def show(self) : 
print (self.。 value) 
>>> 苹 Test(G3) 


>>>t.value # 人 允许 读 取 属 性 值 


>>>t.value=5 # 人 允许 修改 属性 值 


>>>t.show() # 属 性 对 应 的 私有 变量 也 得 到 了 相应 的 修改 
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5 
>>> del t.value 考试 图 删除 属性 ,失败 
RMttributegrror: can't delete attribute 


也 可 以 将 属性 设置 为 可 读 、 可 修改 .可 删除 。 


>>> class Test: 
def 。 init _(self,value): 
self._value=value 


Gef __get(self): 
retum self. _value 


Gef _ set(self,Vv): 
self. value=v 


def _ _del (self) : ## 删 除 对 象 的 私有 数据 成 员 
Gel self. value 


value=property( _get, _set, _del) # 可 读 、 可 写 .可 删除 的 属性 


Gef show(self) : 
print (self。 _value) 
>>>t=Test (3) 
>>>t.show() 
3 
>>>t.value 
Ed 
>>>t.value=5 
>>>t.show() 
5 
>>> t.value 
5 
>>> del t.value 


>>> t.value # 相 应 的 私有 数据 成 员 已 删除 ,访问 失败 
Attributegrror: "Test' dbject has no attribute ，Test _value' 
>>>t-show() 


Attributegrror: "Test' dbject has no attribute ' Test _value' 
>>>t.value=1 # 动 态 增加 属性 和 对 应 的 私有 数据 成 员 


>>>t.show() 


>>>t.value 
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625 类 与 对 象 的 动态 性 、 混 入 机 制 


在 Python 中 可 以 动态 地 为 自 定义 类 和 对 象 增加 数据 成 员 和 成 员 方法 ,这 也 是 
Python 动态 类 型 的 一 种 重要 体现 。 在 6. 2. 3 节 已 经 见 过 相关 的 用 法 ,下 面 再 详细 介绍 


一 下 5 

import types 
class Car (cbject) : 

Price= 100000 # 属 于 类 的 数据 成 员 

def init (self,c): 

self.color=c # 属 于 对 象 的 数据 成 员 

carl= Car ("Red") # 实 例 化 对 象 
Print (carl.color,Car.price) # 访 问 对 象 和 类 的 数据 成 员 
Car.price= 110000 # 修 改 类 属性 
Car.name= 'QR' # 动 态 增加 类 属性 
carl.color= "Yellow" # 修 改 实例 属性 


Print (carl.color,Car.prioe,Car.name) 
Gef setSpeed (self, s): 


Self.speed=s 
carl.setSpeed= types.Methodrype (setSpeed, carl) # 动 态 为 对 象 增加 成 员 方 法 
carl.setSpeed (50) # 调 用 对 象 的 成 员 方法 


Print (carl.speed) 


Python 类 型 的 动态 性 使 得 我 们 可 以 动态 为 自 定义 类 及 其 对 象 增加 新 的 属性 和 行为 ， 
俗称 混入 (mixin) 机 制 , 这 在 大 型 项 目 开 发 中 会 非常 方便 和 实用 。 例 如 ,系统 中 的 所 有 用 
户 分 类 非常 复杂 ,不 同 用 户 组 具有 不 同 的 行为 和 权限 ,并 且 可 能 会 经 常 改变 。 这 时 可 以 独 
立地 定义 一 些 行为 ,然后 根据 需要 来 为 不 同 的 用 户 设置 相应 的 行为 能 力 。 在 动画 设计 中 
也 有 类 似 的 技术 。 例 如 ,可 以 设计 一 些 动作 ,然后 根据 需要 把 这 些 动作 附加 到 相应 的 角 
色 上 。 

>>> jmport types 

>>> class Person (Gbject) : 

Gef__init _ (self,name): 
assert isinstance (name, str), 'name must be string" 


self.name= name 


>>> def sing(self) : 
Print (self.namet ' can sing.') 


>>> def walk (self) : 
print (self.namet ' can walk.') 
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>>> def eat (self) : 
print (self.namet ' can eat.') 


>>> zhang= Persan ("zhang") 

>>> zhang.sing() 

Attributegrror: 'Person' cbject has no attribute 'sing" 
>>> zhang.sing= types.MethodType (sing, zhang) 

>>> zhang.sing() 

zhang can sing. 

>>> zhang.walk () 

Attributegrror: 'Person' dbject has no attribute ‘walk' 
>>> zhang.walk= types.Methodrype (walk, zhang) 

>>> zhang.walk() 

zhang can walk. 

>>> del zhang.walk 

>>> zhang.walk() 

Attributegrror: 'Person' dbject has no attribute "walk' 


6.3 继承 、 多 态 


继承 


# 用 户 不 具有 该 行为 


# 动 态 增加 一 个 新 行为 


# 删 除 用 户 行为 


设计 一 个 新 类 时 ,如 果 可 以 继承 一 个 已 有 的 设计 良好 的 类 然后 进行 二 次 开发 ,可 以 大 


幅度 减少 开发 工作 量 , 并 且 可 以 很 大 程度 地 保证 质量 。 在 继承 关系 中 ,已 有 的 、 设 计 好 的 
类 称 为 父 类 或 基 类 ,新 设计 的 类 称 为 子 类 或 派生 类 。 派 生 类 可 以 继承 父 类 的 公有 成 员 ,但 
是 不 能 继承 其 私有 成 员 。 如 果 需 要 在 派生 类 中 调用 基 类 的 方法 ,可 以 使 用 内 置 函 数 
super() 或 者 通过 “ 基 类 名 . 方法 名 0” 的 方式 来 实现 这 一 目的 。 


示例 6-1 设计 Person 类 ,并 根据 Person 派生 Teacher 类 ,分 别 创 建 Person 类 与 


Teacher 类 的 对 象 。 


# 基 类 必须 继承 于 cbject, 和 否则 在 派生 类 中 将 无 法 使 用 super() 函 数 


class Ferscn (Gbject) : 
def _init _ (self,name= ' "vage= 20,sex= ‘man'): 


# 通 过 调用 方法 进行 初始 化 ,这 样 可 以 对 参数 进行 更 好 控制 


Self .setName (name) 
3elf.sethge (age) 
Self.setSex (sex) 


def setName (self, name): 
证 not isinstance (name, str) : 
raise Fxosption (name must be a string.') 


self. _name= name 
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Gef setAhge (self,age) : 
if type(age) (=int: 
raise Exception (‘age mst be an integer.') 
self. _age= age 


Gef setSex (self, sex): 
if sex not in (‘man', woman'): 
Iaise Exosption('sex mst be "man" or "waman"') 


Self. _sex= sex 


Gef show (self): 
Print (self. _name,self. age,self. _sex,sep='\n') 


# 派 生 类 
class Teacher (Person) : 
def__init _ (self,name= '',age= 30,sex= ‘man',department= 'Computer'): 

# 调 用 基 类 构造 方法 初始 化 基 类 的 私有 数据 成 员 
Super (Teacher,self).__init _ (name,age,sex) 
# 也 可 以 这 样 初始 化 基 类 的 私有 数据 成 员 
# Ferson。 init _ (self,name,age,sex) 
# 初 始 化 派生 类 的 数据 成 员 
self.setDepartment (department) 


def setDepartment (self, department) : 
if type (department) !=str: 
raise Exosption('department mst be a string.') 
self.  _department= department 


# 创 建 基 类 对 象 

zhangsan= Person('Zhang San',19, "man') 
zhangsan.show() 

Print ('="* 30) 


# 创 建 派生 类 对 象 

lisi= Teadher ("Li si',32, man', Math') 
lisi.show() 

# 调 用 继承 的 方法 修改 年 龄 
lisi.setAge (40) 

lisi.show() 
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Python 支持 多 继承 ,如果 父 类 中 有 相同 的 方法 名 ,而 在 子 类 中 使 用 时 没有 指定 父 类 
名 , 则 Python 解释 器 将 从 左 向 右 按 顺序 进行 搜索 ,使 用 第 一 个 匹配 的 成 员 。 


632 多 态 


多 态 (polymorphism) 是 指 基 类 的 同一 个 方法 在 不 同 派生 类 对 和 象 中 具有 不 同 的 表现 和 
行为 。 派 生 类 继承 了 基 类 的 行为 和 属性 之 后 ,还 会 增加 某 些 特定 的 行为 和 属性 ,同时 还 可 
能 会 对 继承 来 的 某 些 行为 进行 一 定 的 改变 ,这 都 是 多 态 的 表现 形式 , 正 所谓 龙 生 九 子 , 子 
子 皆 不 同 。 通 过 第 2 章 的 学 习 大 家 已 经 知道 ,Python 大 多 数 运算 符 可 以 作用 于 多 种 不 同 
类 型 的 操作 数 , 并 且 对 于 不 同类 型 的 操作 数 往往 有 不 同 的 表现 ,这 本 身 就 是 多 态 ,是 通过 
特殊 方法 与 运算 符 重 载 实现 的 ,将 在 6.4 节 进 行 详细 介绍 。 下 面 的 代码 主要 演示 通过 在 
派生 类 中 重 写 基 类 方法 实现 多 态 。 





>>> class Animal (Gbject) : # 定 义 基 类 
def show (self) : 
Print('I am an animal.') 
>>> class Cat (Animal) : # 派 生 类 ,覆盖 了 基 类 的 show() 方 法 
def show(self) : 
Print('I ama cat.') 
>>> class Dog (Animal) : # 派 生 类 
def show(self) : 
Print('I an a dog.') 
>>> class Tiger (animal) : # 派 生 类 
def show(self) : 
Print('I ama tiger.') 
>>> class Test (animal) : # 派 生 类 ,没有 覆盖 基 类 的 show() 方 法 
pass 
>>> = [item() for item in (Animal,Cat,Dog, Tiger, Test)] 
>>> for item in x: # 遍 历 基 类 和 派生 类 对 象 并 调用 show() 方 法 
item.show() 
I am an animal. 
Iamacat. 
I ama dog. 
I ama tiger. 
I am an animal. 


6.4 特殊 方法 与 运算 符 重 载 


Python 类 有 大 量 的 特殊 方法 ,其 中 比较 常见 的 是 构造 方法 和 析 构 方法 。Python 中 
类 的 构造 方法 是 __init__O 〇 ,用 来 为 数据 成 员 设置 初始 值 或 进行 其 他 必要 的 初始 化 工作 ， 
在 实例 化 对 象 时 被 自动 调用 和 执行 。 如 果 用 户 没有 设计 构造 方法 ,Python 会 提供 一 个 
默认 的 构造 方法 用 来 进行 必要 的 初始 化 工作 。Python 中 类 的 析 构 方法 是 _deL__() ,一 
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般 用 来 释放 对 象 占用 的 资源 ,在 Python 删除 对 象 和 收回 对 象 空间 时 被 自动 调用 和 执 
行 。 如 果 用 户 没 有 编写 析 构 方法 ,Python 将 提供 一 个 默认 的 析 构 方法 进行 必要 的 清理 


工作 


在 Python 中 ,除了 构造 方法 和 析 构 方法 之 外 ,还 有 大 量 的 特殊 方法 支持 更 多 的 功 
能 。 例 如 ,运算 符 重 载 就 是 通过 在 类 中 重 写 特 殊 方法 实现 的 。 在 自 定义 类 时 如 果 重 写 了 
某 个 特殊 方法 即 可 支持 对 应 的 运算 符 或 内 置 函 数 , 具 体 实现 什么 工作 则 完全 可 以 由 程序 
员 根 据 实际 需要 来 定义 。 表 6-1 列 出 了 其 中 一 部 分 比较 常用 的 特殊 成 员 , 完 整 列表 请 参 


考 下 面 的 网 址 : 


https://docs.python.org/3/referenoe/datamodel .html# special- method- names 


表 6-1 Python 类 的 特殊 成 员 


















































方 法 功能 说 明 
_new_() 类 的 静态 方法 ,用 于 确定 是 否 要 创建 对 象 
_init_O 构造 方法 ,创建 对 象 时 自动 调用 
_del_0O 析 构 方法 ,释放 对 象 时 自动 调用 
__add_0O 十 
__sub__() 三 
__mul_() x 
__truediv_() / 

__floordiv_O) // 

__mod__() % 

一 pow__() Wy 

eq _(O)、 ne_(), 

= A le Ds ==,!=,<, <=.>,>= 
Bt (00s. ge OO) 

lshift_ Orshift_() |<<.>> 
re 

_iadd_ Oisub_O 十 二 ,一 二 ,很 多 其 他 运算 符 也 有 与 之 对 应 的 复合 赋值 运算 符 
__pos_0O 一 元 运算 符 十 , 正 号 
2 一 元 运算 符 一 , 负 号 





__contains__ () 


与 成 员 测 试 运算 符 in 对 应 





radd QO) rsub_O) 


反射 加 法 、 反 射 减法 ,一 般 与 普通 加 法 和 减法 具有 相同 的 功能 ,但 操作 
数 的 位 置 或 顺序 相反 ,很 多 其 他 运算 符 也 有 与 之 对 应 的 反射 运算 符 





_abs_0O 


与 内 置 函数 abs() 对 应 





bool_ Oi 





与 内 置 函数 bool() 对 应 ,要 求 该 方法 必须 返回 True 或 False 
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续 表 
方 法 功能 说 明 

__bytes_() 与 内 置 函数 bytes() 对 应 
__complex_() 与 内 置 函数 complex() 对 应 ,要 求 该 方法 必须 返回 复数 
1 与 内 置 函数 dir() 对 应 
__divmod QO) 与 内 置 函 数 divmod() 对 应 
__float_ (0) 与 内 置 函 数 float() 对 应 ,要 求 该 方法 必须 返回 实数 
__hash_O 与 内 置 函 数 hash() 对 应 
__int (0) 与 内 置 函数 int() 对 应 ,要 求 该 方法 必须 返回 整数 
_len_0O 与 内 置 函 数 len() 对 应 
__next_() 与 内 置 函数 next() 对 应 
__reduce_() 提供 对 reduce() 函 数 的 支持 
__reversed_() 与 内 置 函 数 reversed() 对 应 
__round_() 与 内 置 函 数 round() 对 应 
__str_() 与 内 置 函数 str() 对 应 ,要 求 该 方法 必须 返回 str 类 型 的 数据 
__repr_() 打印 .转换 ,要 求 该 方法 必须 返回 str 类 型 的 数据 
__getitem__() 按照 索引 获取 值 
__setitem__() 按照 索引 赋值 
__delattr _() 删除 对 象 的 指定 属性 
__getattr_() 获取 对 象 指定 属性 的 值 , 对 应 成 员 访 问 运 算 符 “.” 

获取 对 象 指定 属性 的 值 ,如果 同时 定义 了 该 方法 与 _getattr__() ,那么 
__getattribute_() __getattr () 将 不 会 被 调用 ,除非 在 __getattribute__() 中 显 式 调用 

__getattr__() 或 者 抛 出 AttributeError 异常 
__setattr_() 设置 对 象 指定 属性 的 值 
__base _ 该 类 的 基 类 
__class__ 返回 对 象 所 属 的 类 
__dict__ 对 象 所 包含 的 属性 与 值 的 字典 
__subclasses__() 返回 该 类 的 所 有 子 类 
_call_0O 包含 该 特殊 方法 的 类 的 实例 可 以 像 函数 一 样 调用 
ed 定义 了 这 3 个 特殊 方法 中 任何 一 个 的 类 称 为 描述 符 (descriptor) ,描述 
__set_() 符 对 象 一 般 作为 其 他 类 的 属性 来 使 用 ,这 3 个 方法 分 别 在 获取 属性 、 修 

lete 改 属性 值 或 删除 属性 时 被 调用 
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651 自 定义 队列 


队列 是 一 种 特殊 的 线性 表 , 只 允许 在 队列 尾部 插入 元 素 和 在 队列 头 部 删除 元 素 , 具 有 
“先入 先 出 ”(FIFO) 或 “后 入 后 出 ”LILO) 的 特点 ,在 多 线程 编程 .作业 管理 等 方面 具有 重 
要 的 应 用 。 

Python 列表 对 象 的 append() 方 法 用 于 在 列表 尾部 追加 元 素 ,pop(0) 可 以 删除 并 返 
回 列 表 头 部 的 元 素 , 可 以 模拟 队列 结构 的 操作 。 


>>> 三 [] 

>>> x.append (1) # 在 尾部 追加 元 素 ,模拟 入 队 操 作 
>>> x.append (2) 

>>> x.append (3) 

>>>x 

[1,2,3] 

>>>x.pop(0) # 在 头 部 弹出 元 素 ,模拟 出 队 操作 
>>> x.pop(0) 

2 

>>> x.pop(0) 

3 

>>>x 

0 

>>> x.pop(0) # 空 队列 弹出 头 部 元 素 失败 , 抛 出 异常 
IndexError: Pop from empty list 


从 上 面 的 代码 可 以 看 出 ,使 用 Python 列表 直接 模拟 队列 结构 ,无 法 限制 队列 的 大 
小 ,并 且 当 列表 为 空 时 进行 弹出 元 素 的 操作 会 抛 出 异常 。 可 以 对 列表 进行 封装 ,增加 外 围 
代码 , 自 定义 队列 类 来 避免 这 些 问题 。 

示例 6-2 设计 自 定义 双 端 队列 类 ,模拟 入 队 、 出 队 等 基本 操作 。 


class myDeque: 
# 构 造 方法 ,默认 队列 大 小 为 10 
def __init _ (self,iterable=None,maxlen=10): 
if iterable== None: 
self._ coontent= [] 
self. current=0 
else: 
self. content=— list (iterable) 
self._ current= len(iterable) 
self. size=maxlen 
证 self. size< self. current: 
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self. sizer self. current 


# 析 构 方法 
def del (self): 
del self. content 


# 修 改 队列 大 小 
Gef setSize (self, size): 
if size< self. current: 
# 如 果 缩 小 队列 ,需要 同时 删除 后 面 的 元 素 
for i in range (size,self. current)[::-1]: 
del self. coontent[i] 
Self. current= size 


Self. size= size 


# 在 右 侧 人 队 
Sef appendRight (self,V) : 
证 self. current< self. size: 
self._content.append (v) 
self. current= self. current +1 
else: 
Print ("The queve is full') 


# 在 左 侧 入 队 
ef appendLeft(self,v) : 
if self. current< self. size: 
self。content.insert (0,v) 
self. current= self. current +1 
else: 
Print ("The queve is full') 


# 在 左 侧 出 队 
def popLeft (self) : 
if self. content: 
Self. current= self. current -1 
return self. oontent.pop(0) 
else: 
print ('The queve is epty’) 


# 在 右 侧 出 队 
def popRight (self) : 
证 self. content: 
self. current= self. current -1 
Teturn self. content.pop() 
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else: 
print ("The queve is erpty') 


# 循 环 移 位 
def rotate (self,k) : 
if abs (k)> self. current: 
Print ('k mst <= "+ str (self. current)) 
Teturn 
Self。content= self. content[- k:] + self. content[:- k] 


# 元 素 翻 转 
Gef reverse (self) : 
Self. oontent= self. content[::-1] 


# 显 示 当 前 队列 中 元 素 的 个 数 
Gef__len _(self): 
Tetum self. current 


# 使 用 print() 打 印 对 象 时 ,显示 当前 队列 中 的 元 素 
def__str _ (self): 
retum mypecpe(' + str (self. content) + "maxlenr + str (self. size) +')" 


# 直 接 对 象 名 当 作 表 达 式 时 ,显示 当前 队列 中 的 元 素 
去 
# 队 列 置 空 
Gef clear (self) : 
self._ content= [] 
Self. current=0 


# 测 试 队列 是 否 为 空 
ef isEmpty(self) : 
Teturn not self. content 


# 测 试 队列 是 否 已 满 
Gef isFull (self) : 
Teturn self. current== self. size 
if_ name ==' min _': 


rt Ee oe i Ba nanie, ') 
将 上 面 的 代码 保存 为 myDeque. py 文件 ,并 保存 在 当前 文件 夹 .Python 安装 文件 夹 


或 sys. path 列表 指定 的 其 他 文件 夹 中 ,当然 也 可 以 使 用 append() 方 法 把 该 文件 所 在 文件 
夹 添加 到 sys. path 列表 中 。 下 面 的 代码 演示 了 自 定义 队列 类 的 用 法 : 





>>> from myDegue jimport myDeque 
>>> 守 mYDeque (range (5)) 

> 

myDeque ([0,1,2,3, 4] ,maxlen= 10) 
>>> q.appendIeft (- 1) 

>>> q.appendRight (5) 

>>>q 

myDeque ([- 1,0,1,2,3,4,5] ,maxler= 10) 
>>> q.PopLeft () 

= 和 

>>> qPoFPRight() 

5 

>>> q.reverse() 

>>>q 

myDeque ([4,3,2,1,0] ,maxlen= 10) 
>>> q.isEmpty() 

False 

>>> q.rotate(- 3) 

>>>q 

myDeque ([1,0,4,3,2] ,maxlen= 10) 
>>> q.setSize (20) 

>>>q 

myDeque ([1,0,4,3,2] ,maxlen= 20) 
>>> q.clear() 

>>>q 

myDeque ([] ,maxlen= 20) 

>>> q.isErpty() 

True 


652 自 定义 栈 
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# 导 入 自 定 义 双 端 队列 类 
## 创 建 双 端 队列 对 象 


# 在 队列 左 侧 入 队 
# 在 队列 右 侧 入 队 


# 在 队列 左 侧 出 队 


# 在 队列 右 侧 出 队 


# 元 素 翻 转 


# 测 试 队列 是 否 为 空 


# 元 素 循环 左 移 


# 改 变 队列 大 小 


# 清 空 队列 元 素 


栈 也 是 一 种 运算 受 限 的 线性 表 , 仅 允许 在 一 端 进行 元 素 的 插入 和 删除 操作 ,最 后 人 栈 
的 元 素 最 先 出 栈 ,最 先 人 栈 的 元 素 最 后 出 栈 , 即 * 先 人 后 出 ”(FILO) 或 “后 人 先 出 ” 


(LIFO) 。 


使 用 Python 列表 对 象 提供 的 append()、pop() 方 法 也 可 以 模拟 栈 结 构 及 其 基本 运 
算 ,但 无 法 限制 栈 的 大 小 ,并 且 在 栈 为 空 时 尝试 获取 其 元 素 时 会 引发 异常 。 


>>>=[] 

>>> s.append (3) 
>>> s.append(5) 
>>> s.append (7) 
>>>s 


[3,5,7] 


# 在 尾部 追加 元 素 ,模拟 人 栈 操作 
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>>> s.pop() 

. 

>>> s.pop() 

5 

>>> s.pop() 

3 

>>> s.pop() 

IndexError: pop from empty list 


# 在 尾部 弹出 元 素 ,模拟 出 栈 操 作 


# 列 表 已 空 ,弹出 失败 


如 同 封装 Python 列表 实现 自 定义 队列 类 一 样 ,也 可 以 对 Python 列表 进行 封装 来 模 


示例 6-3 设计 自 定义 栈 类 ,模拟 入 栈 、 出 栈 、 判 断 栈 是 否 为 空 判断 栈 是 否 已 满 以 及 


改变 栈 大 小 等 操作 。 


class Stack: 
# 构 造 方法 


Gef init _ (self,maxler= 10) : 


Self. content= [] 
Self. size=maxlen 
Self. current=0 


# 析 构 方法 ,释放 列表 控件 
def del _(self): 
Gel self。content 


# 清 空 栈 中 的 元 素 

Gef clear (self) : 
self._content= [] 
Self. current=0 


# 测 试 栈 是 否 为 空 
Gef isEmpty (self): 


Tetum not self. content 


# 修 改 栈 的 大 小 
Gef setSize (self, size): 


# 不 允许 新 的 栈 大 小 小 于 已 有 元 素数 量 


if size< self. current: 


Print ('new size mst >=" +str(self. current)) 


Teturn 


self. size= size 


# 测 试 栈 是 否 已 满 
def isFull (self) : 





retum self. current—=self. size 


# 人 栈 
def push (self,v) : 
if self. current< self. size: 
# 在 列表 尾部 追加 元 素 
self。content.append (wj 
# 栈 中 元 素 个 数 加 1 
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Self. current= self. current +1 


else: 
Print ('Stack is Full!') 


# 出 栈 
Gef pop (self) : 
if self. content: 
# 栈 中 元 素 个 数 减 1 


Self. current= self. current -1 


# 弹 出 并 返回 列表 尾部 元 素 

return self. content.pop() 
else: 

Print ('Stack is empty!') 


def__str _(self): 


retum 'Stack(' + str (self. content) + "maxlen= ' + str(self. size) + ')" 


# 复 用 __str 方法 的 代码 
repr =__str 


将 代码 保存 为 myStack. py 文件 ,下 面 的 代码 演示 了 自 定义 栈 结构 的 用 法 。 


>>> fram myStack import Stack 
>>> = Stack() 

>>> s.push (5) 

>>> s.push (8) 

>>> s.push('a') 

>>> 3.pop() 

‘a 

>>> s.push('b') 

>>> s.push('c') 

>>>s 

Stack ([5,8, 'b', 'c'] ,maxlen= 10) 
>>> 3.setSize (8) 

>>>s 

Stack ([5,8, 'b', 'c'] ,maxlen= 8) 
>>> 3.3etSize (3) 


# 导 入 自 定 义 栈 
# 创 建 栈 对 象 
# 元 素 信 栈 


# 元 素 出 栈 


## 查 看 栈 对 象 


# 修 改 栈 大 小 
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new size mst >=4 


>>> s.clear() # 清 空 栈 元 素 
>>> s.isEmpty() 
True 


>>> s-setsize(2) 
>>> s-push (1) 
>>> s.push (2) 
>>> s.push (3) 
Stack Full! 


本 章 小 结 


(1) 面向 对 象 程序 设计 的 关键 是 如 何 合理 地 定义 类 并 且 组 织 多 个 类 之 间 的 关系 。 

(2) Python 是 面向 对 象 的 解释 型 高 级 动态 编程 语言 ,完全 支持 面向 对 象 的 基本 功能 
和 全 部 特性 。 

(3) 定义 类 的 成 员 时 ,如 果 某 个 成 员 以 2 个 (或 更 多 ) 下 画 线 开 头 并 且 不 以 2 个 (或 更 
多 ) 下 面 线 结束 , 则 表示 是 私有 成 员 。 

(4) 在 类 的 外 部 不 能 直接 访问 私有 成 员 , 但 是 可 以 通过 一 种 特殊 的 形式 对象 名 . _ 类 
名 __ 私 有 成 员 名 ”来 访问 。 

(5) 函数 和 方法 这 两 个 概念 有 本 质 的 区 别 。 

(6) 所 有 实例 方法 都 必须 至 少 有 一 个 名 为 self 的 参数 ,并 且 必 须 是 第 一 个 参数 。 

(7) 属性 是 一 种 特殊 形式 的 成 员 方法 ,结合 了 公开 数据 成 员 和 成 员 方 法 两 者 的 优点 。 

(8) Python 类 型 的 动态 性 使 得 人 们 可 以 动态 地 为 自 定义 类 及 其 对 象 增加 新 的 属性 
和 行为 ,俗称 混入 机 制 。 

(9) 如 果 需 要 在 派生 类 中 调用 基 类 的 方法 ,可 以 使 用 内 置 函 数 super() 或 者 通过 “ 基 
类 名 .方法 名 () "的 形式 。 

(10) 多 态 是 指 基 类 的 同一 个 方法 在 不 同 派生 类 对 象 中 具有 不 同 的 表现 和 行为 。 

(11) Python 类 中 前 后 各 有 2 个 下 画 线 的 成 员 表 示 特 殊 成 员 , 这 些 特 殊 成 员 是 预定 
久 好 的 。 

(12) Python 类 的 特殊 方法 与 特定 的 内 置 函 数 或 运算 符 相 对 应 ,在 自 定义 类 中 实现 
了 某 个 特殊 方法 ,就 支持 了 某 个 运算 符 和 内 置 函 数 。 


习 题 


6.1 继承 6.3 节 例 6-1 中 的 Person 类 生成 Student 类 ,填写 新 的 方法 用 来 设置 学 生 
专业 ,然后 生成 该 类 对 象 并 显示 信息 。 

6.2 设计 一 个 三 维 向 量 类 ,并 实现 向 量 的 加 法 、 减 法 以 及 向 量 与 标量 的 乘法 和 除法 

算 


[et 


6.3 面向 对 象 程序 设计 的 三 要 素 分 别 为 <、 和 
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6.4 简单 解释 Python 中 以 下 画 线 开头 的 变量 名 的 含义 。 

6.5 与 运算 符 x** 对 应 的 特殊 方法 名 为 ,与 运算 符 // 对 应 的 特殊 方法 名 
为 

6.6 假设 a 为 类 A 的 对 象 且 包含 一 个 私有 数据 成 员 __value, 那 么 在 类 的 外 部 通过 
对 象 a 直接 将 其 私有 数据 成 员 __value 的 值 设 置 为 3 的 语句 可 以 写作 





第 7 章 
8M 文本 处 理 (一 ): 字符 串 





Ss 


在 Python 中 ,字符 串 属于 不 可 变 有 序 序列 ,使 用 单 引号 (这 是 最 常用 的 ,或 许 是 因为 
硕 键 盘 方 便 )、 双 引号 、 三 单 引号 或 三 双 引 号 作为 定 界 符 ,并 且 不 同 的 定 界 符 之 间 可 以 互相 
嵌 套 。 下 面 几 种 都 是 合法 的 Python 字符 串 : 


‘abc'、"123'、' 中 国 '、 "python"、 '' Tan said, "Tet's go 


除了 支持 序列 通用 操作 (包括 双向 索引 、 比 较 大 小 、 计 算 长 度 、 元 素 访问 切片 成员 测 
试 等 ) 以 外 ,字符 串 类 型 还 支持 一 些 特有 的 用 法 ,如 字符 串 格 式 化 、 查 找 、 替 换 、 排 版 等 。 但 
由 于 字符 串 属于 不 可 变 序 列 ,不 能 直接 对 字符 串 对 象 进行 元 素 增加 修改 与 删除 等 操作 ， 
切片 操作 也 只 能 访问 其 中 的 元 素 而 无 法 使 用 切片 来 修改 字符 串 中 的 字符 。 另 外 ,字符 串 
对 象 提供 的 replace() 和 translate() 方 法 以 及 大 量 排版 方法 也 不 是 对 原 字 符 串 直接 进行 
修改 蔡 换 ,而 是 返回 一 个 新 字符 串 作为 结果 。 

如 果 需 要 判断 一 个 变量 是 否 为 字符 串 , 可 以 使 用 内 置 方法 isinstance() 或 type()。 除 
了 支持 Unicode 编码 的 str 类 型 之 外 ,Python 还 支持 字 节 串 类 型 bytes,str 类 型 字符 串 可 
以 通过 encode() 方 法 使 用 指定 的 字符 串 编 码 格式 编码 成 为 bytes 对 象 ,而 bytes 对 象 则 
可 以 通过 decode() 方 法 使 用 正确 的 编码 格式 解码 成 为 str 字符 串 。 另 外 ,也 可 以 使 用 内 
置 函数 str() 和 bytes() 在 这 两 种 类 型 之 间 进 行 转换 。 


>>>type(" 中 国 ) 

<class 'str'> 

>>> type('" 中 国 '.encode('gpk')) # 编 码 成 字 节 串 ,采用 Gx 编码 格式 
<class 'bytes'> 

>>> bytes #bytes 也 是 Python 的 内 置 类 
<class 'bytes'> 

>>> isinstance(" 中 国 …str) 

True 

>>>type(" 中 国 )== str 

True 

>>>type(" 中 国 '.encode())==bytes 

True 

>>> "中 国 '.encode() # 默 认 使 用 Ure- 8 进行 编码 
b'\xeA\xb8\xad\xe5\xP\xbd' 
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>>>_.decode() # 默 认 使 用 UIE- 8 进行 解码 
"中 国 ' 

>>>bytes(' 董 付 国 ','gok') 

b'\xbé\xad\xb8\xbé\ sbI\xfa' 

>>> str( ,'gok') 


曹 付 国 ， 
7.1 字符 串 编码 格式 简介 


最 早 的 字符 串 编 码 是 美国 标准 信息 交换 码 ASCII, 仅 对 10 个 数字 、26 个 大 写 英 文字 
母 .26 个 小 写 英文 字母 及 一 些 其 他 符号 进行 了 编码 。ASCII 码 采 用 一 个 字 节 来 对 字符 进 
行 编码 ,最 多 只 能 表示 256 个 符号 。 

随 着 信息 技术 的 发 展 和 信息 交换 的 需要 ,各 国 的 文字 都 需要 进行 编码 ,不 同 的 应 用 领 
域 和 场合 对 字符 串 编码 的 要 求 也 略 有 不 同 , 于 是 又 分 别 设计 了 多 种 不 同 的 编码 格式 ,常见 
的 主要 有 UTF-8、UTF-16、UTF-32、GB2312 .GBK 、CP936、base64、CP437 等 。UTF-8 对 
全 世界 所 有 国家 需要 用 到 的 字符 进行 了 编码 ,以 一 个 字 节 表示 英语 字符 (兼容 ASCID ,以 
3 个 字 节 表示 中 文 ,还 有 些 语言 的 符号 使 用 2 个 字 节 (如 俄语 和 希腊 语 符号 ) 或 4 个 字 节 。 
GB2312 是 我 国 制定 的 中 文 编码 ,使 用 一 个 字 节 表示 英语 ,2 个 字 节 表示 中 文 ;GBK 是 
GB2312 的 扩充 ,而 CP936 是 微软 公司 在 GBK 基础 上 开发 的 编码 方式 。GB2312、GBK 和 
CP936 都 是 使 用 2 个 字 节 表示 中 文 。 

不 同 的 编码 格式 之 间 相 差 很 大 ,采用 不 同 的 编码 格式 意味 着 不 同 的 表示 和 存储 形式 ， 
把 同一 字符 存 和 文件 时 , 写 入 的 内 容 可 能 会 不 同 , 在 试图 理解 其 内 容 时 必须 了 解 编码 规则 
并 进行 正确 的 解码 。 如 果 解 码 方法 不 正确 就 无 法 还 原 信息 ,从 这 个 角度 来 讲 , 字 符 串 编码 
也 具有 加 密 的 效果 。 

Python 3. x 完全 支持 中 文字 符 , 默 认 使 用 UTF-8 编码 格式 ,无 论 是 一 个 数字 、 英 文 
字母 ,还 是 一 个 汉字 ,都 按 一 个 字符 对 待 和 处 理 。 在 Python 3. x 中 甚至 可 以 使 用 中 文 作 
为 变量 名 、 函 数 名 等 标识 符 , 这 在 示例 5-29 中 曾经 演示 过 。 


>>> jimport sys 

>>> sys.getdefaultencoding () # 查 看 默认 编码 格式 

tf- 8 

>>> 二 "中国 山东 烟台 ' 

>>> len(s) # 字 符 串 长 度 ,或 者 包含 的 字符 个 数 
6 

>>> 一 "中 国 山 东 烟 台 aBCTE' # 中 文 与 英文 字符 同样 对 待 ,都 算 一 个 字符 
>>> len(s) 

1 

>>> 姓 名 = " 张 三 " # 使 用 中 文 作 为 变量 名 

>>>print 姓名 ) # 输 出 变量 的 值 


张 三 
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7.2 转 义 字符 与 原始 字符 串 


转 义 字符 是 指 , 在 字符 串 中 某 些 特定 的 符号 前 加 一 个 斜 线 之 后 ,该 字符 将 被 解释 为 另 
外 一 种 含义 ,不 再 表示 本 来 的 字符 。Python 中 常用 的 转 义 字符 如 表 7-1 所 示 。 


表 7-1 Python 中 常用 的 转 义 字符 



































转 义 字符 含义 转 义 字符 含 义 
\b 退 格 ,把 光标 移动 到 前 一 列 位 置 \ 一 个 斜 线 \ 
ff 换 页 符 时 单 引号 ' 
\n 换行 符 We 双 引 号 " 
\r 回 车 \ooo 3 位 八进制 数 对 应 的 字符 
\t 水 平 制 表 符 \xhh 2 位 十 六 进 制 数 对 应 的 字符 
\v 垂直 制 表 符 \uhhhh | 4 位 十 六 进 制 数 表示 的 Unicode 字符 
下 面 的 代码 演示 了 转 义 字符 的 用 法 : 
>>> print ('Hello\rmorld') # 包 含 转 义 字符 的 字符 串 
Hello 
world 
>>>print ("\101') #3 位 八进制 数 对 应 的 字符 
Sa #2 位 十 六 进 制 数 对 应 的 字符 
a #4 位 十 六 进 制 数 表示 的 Unicode 字 符 


我 是 董 付 国 


为 了 避免 对 字符 串 中 的 转 义 字符 进行 转 义 ,可 以 使 用 原始 字符 串 ,在 字符 串 前 面 加 上 
字母 + 或 R 表示 原始 字符 串 , 其 中 的 所 有 字符 都 表示 原始 的 含义 而 不 会 进行 任何 转 义 , 常 
用 在 文件 路 径 、URL 和 正则 表达 式 等 场合 。 


>>> path= 'C:\Windows\notepad.exe' 
>>> print (path) 


>>> path= r'C:\Windows\notepad.exe' 
>>> print (path) 
C: \Windows\notepad.exe 


# 字 符 \n 被 转 义 为 换行 符 


# 原 始 字符 串 ,任何 字符 都 不 转 义 
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7.3 字符 串 格 式 化 
731 使 用 % 符号 进行 格式 化 


使 用 % 符 号 进行 字符 串 格式 化 的 形式 如 图 7-1 所 示 ,格式 运算 符 % 之 前 的 部 分 为 格 
式 字符 串 , 之 后 的 部 分 为 需要 进行 格式 化 的 内 容 。 


% 口中 [0] [fm] [n] 格式 字符 '% x 


仁 待 转换 的 表达 式 
格式 运算 符 


指定 类 型 

指定 精度 

指定 最 小 宽度 

指定 空位 填 0 

对 正 数 加 正 号 
指定 左 对 齐 输出 

格式 标志 ， 表 示 格 式 开始 


图 7-1 字符 串 格式 化 的 形式 

















Python 支持 大 量 的 格式 字符 , 表 7-2 列 出 了 比较 常用 的 一 部 分 。 


























表 7-2 格式 字符 
格式 字符 说 明 格式 字符 说 明 
%s 字符 串 〈 采 用 str() 的 显示 ) %%x 十 六 进 制 整数 
%r 字符 串 (采用 repr() 的 显示 ) %e 指数 (基底 写 为 e) 
%e 单个 字符 %E 指数 (基底 写 为 E) 
%% 字符 % %f、%F | 浮 点 数 
%d 十 进 制 整数 %g 指数 (e) 或 浮 点 数 (根据 显示 长 度 ) 
%i 十 进 制 整数 %G 指数 (E) 或 浮 点 数 (根据 显示 长 度 ) 
%o 八进制 整数 














使 用 这 种 方式 进行 字符 串 格式 化 时 ,要 求 被 格式 化 的 内 容 和 格式 字符 之 间 必 须 一 一 
对 应 。 


>>> 六 1235 

>>> sor " 史 on Sx 
>>> so 

42323" 

>>> sh "x" Sx 
>>> sh 

ds 
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>>> se "Se" sx 

>>> se 

"1.235000et+ 03" 

>>> 吃 s" $65 # 等 价 于 str() 

,65， 

>>> 哆 3" 当 65333 

,65333， 

>>> sd,sc' % (65,65) # 使 用 元 组 对 字符 串 进 行 格式 化 , 按 位 置 进行 对 应 
‘65,A! 

>>> Sd" "555" # 试 图 将 字符 串 转换 为 整数 进行 输出 , 抛 出 异常 
TypeError: $d fomat: a nnber is required,not str 

>>> '®%s"' $ [1,2,3] 

"T2531" 

>>> str((1,2,3)) # 可 以 使 用 str 0 函数 将 任意 类 型 数据 转换 为 字符 串 
"SD 

>>> str([1,2,3]) 

"2 


732 使 用 formet0) 方 法 进行 字符 串 格式 化 


除了 7.3.1 节 介 绍 的 字符 串 格式 化 方法 之 外 ,目前 Python 社区 更 推荐 使 用 format() 
方法 进行 格式 化 ,该 方法 非常 灵活 ,不 仅 可 以 使 用 位 置 进 行 格式 化 ,还 支持 使 用 关键 参数 
进行 格式 化 ,更 妙 的 是 支持 序列 解 包 格 式 化 字符 串 ,为 程序 员 提 供 了 非常 大 的 方便 。 

在 字符 串 格式 化 方法 format() 中 可 以 使 用 的 格式 主要 有 b( 二 进 制 格式 )、c( 把 整数 
转换 成 Unicode 字符 ) 、d( 十 进 制 格式 )、o( 八 进 制 格 式 )、x( 小 写 十 六 进 制 格式 )、X( 大 写 
上 六 进 制 格 式 ) 、e/E( 科 学 计数 法 格式 ) 、f/F( 固 定 长 度 的 浮 点 数 格式 )、% (使 用 固定 长 度 
浮 点 数 显 示 百 分 数 )。Python 3. 6. x 开始 支持 在 数字 常量 的 中 间 位 置 使 用 单个 下 画 线 作 
为 分 隔 符 来 提高 数字 可 读 性 ,相应 地 ,字符 串 格式 化 方法 format() 也 提供 了 对 下 画 线 的 
支持 。 下 面 的 代码 演示 了 其 中 的 部 分 用 法 : 


>>> 1/3 

0.3333333333333333 

>>> Print ('{0:.3f}".fomat (1/3)) # 保 留 3 位 小 数 

0.333 

>>> '{0:% ]} .fomat (3.5) # 格 式 化 为 百分数 

>>> "{0:_}, {0:_x}' .fommat (1000000) # Python 3.6.0 及 更 高 版 本 支持 
"1 000 000,£ 4240" 

>>> "{0:_},{0:_x}'.formmat (10000000) 。 # Python 3.6.0 及 更 高 版 本 支持 
"10 000 000, 98 9680" 

>>> print ("The number {0:,} inhexis: {0:#x},inoct is {0:#0}".format(55)) 
The number 55 in hex is: 0x37, in oct is 0067 


>>> print ("The number {0:,} in hex is: {0:x}, the number {1} inoct is {1:0}".format 
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(5555,55)) 
The number 5, 555 in hex is: 15b3, the number 55 in oct is 67 
>>> print ("The number {1} in hex is: {1:# x}, the number {0} in oct is {0:# o}". 
format (5555,55)) 
The number 55 in hex is: 0x37, the number 5555 in oct is 0012663 
>>> print ("my name is {name}, my age is {age}, and my QQ is {qq}". format (name= 
"Dong", qq= "306467355", age= 38)) 
my name is Dong, my age is 38,and my QQ is 306467355 
>>> position= (5,8,13) 
>>> print ("x: {0[0] };Y:{0[1]};2:{0[2]}".fommat (position)) 
# 使 用 元 组 的 同时 格式 化 多 个 值 
X:57Y:872:13 
>>> weather= [ ("Monday", "rain"), ("Tuesday"," sunny") ，("Wednesday"," sunny" ) ， 
("Thursday", "rain"), ("Friday", "cloudy")] 
>>> formatter= "Weather of ' {0[0]}"' is'{0[1]}'".format 
>>> for item in map (formatter, weather) : 


Print (item) 
上 面 最 后 一 段 代 码 也 可 以 改 为 下 面 的 写法 : 


>>> for item in weather: 
Print (formatter (item)) 


和 结果 为 





运 


Weather of 'Monday' is 'rain' 
Weather of "Tuesday' is 'sunny' 
Weather of 'Wednesday' is 'sunny" 
Weather of 'Thursday' is "rain' 
Weather of 'Friday' is 'cloudy' 


733 格式 化 的 字符 串 常量 


从 Python 3. 6. x 开始 支持 一 种 新 的 字符 串 格 式 化 方式 ,官方 称 为 Formatted String 
Literals, 其 含义 与 字符 串 对 象 的 format() 方 法 类 似 ,但 形式 更 加 简洁 。 


>>> name= "Dong'" 

>>> age= 39 

>>> f'My name is {name},and I am {age} years old." 
"My name is Dong,and I am 39 years old." 

>>> width= 10 

>>> precision= 4 

>>> value= 11/3 

>>> f'result: {value: {width}. {precision}}" 
"result: 3.667" 
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734 使 用 Template 模板 进行 格式 化 


Python 标准 库 string 还 提供 了 用 于 字符 串 格式 化 的 模板 类 Template, 可 以 用 于 大 
量 信息 的 格式 化 ,尤其 适用 于 网 页 模板 内 容 的 蔡 换 和 格式 化 。 例 如 : 


>>> fram string import Template 

>>> t= Template ("My name is $ fnamej,and is $ {age} years old.') ”# 创 建 模板 
>>> d= {'name':'Dong', 'age' :39} 

>>>t.substitute (gd) # 替 换 

"My name is Dong,and is 39 years old." 

>>> tt= Template('My name is $ name,and is $ age years old.') 

>>> tt.substitute(d) 

"My name is Dong,and is 39 years old." 

>>> html= '''< html> < head> $ {head}< /head> <body> $ {body}< /body> < /html> ' 
>>> t= Tenrplate (html) 

>>> d= {'head' : 'test', 'body':'This is only a test.'} 

>>>t.substitute (qd) 

'<html> < head> test< /head> < body> This is only a test.< /body> < /html> ' 





7.4 字符 串 常用 操作 


Python 字符 串 对 象 提 供 了 大 量 方法 用 于 字符 串 的 检测 、 蔡 换 和 排版 等 操作 ,另外 还 
有 大 量 内 置 函数 和 运算 符 也 支持 对 字符 串 的 操作 。 使 用 时 需要 注意 的 是 ,字符 串 对 象 是 
不 可 变 的 ,所 以 字符 串 对 象 提供 的 涉及 字符 串 * 修 改 "的 方法 都 是 返回 修改 后 的 新 字符 串 ， 
并 不 对 原 字符 串 做 任何 修改 ,无 一 例外 。 


741 find0 .rfind) inded) rinded) .court() 


find() 和 rfind() 方 法 分 别 用 来 查找 一 个 字符 串 在 另 一 个 字符 串 指定 范围 (默认 是 整 
个 字符 串 ) 中 首次 和 最 后 一 次 出 现 的 位 置 , 如 果 不 存在 则 返回 一 1;index() 和 rindex() 方 
法 用 来 返回 一 个 字符 串 在 另 一 个 字符 串 指定 范围 中 首次 和 最 后 一 次 出 现 的 位 置 , 如 果 不 
存在 则 抛 出 异常 ;count() 方 法 用 来 返回 一 个 字符 串 在 另 一 个 字符 串 中 出 现 的 次 数 ,如 果 


不 存在 则 返回 0。 
>>> == "apple,peach,banana, peach, pear™" 
>>> s.find ("peach") # 返 回 第 一 次 出 现 的 位 置 
6 
>>> s.find (peach 7) # 从 指定 位 置 开 始 查找 
19 
>>> s.find ("peach", 7,20) # 在 指定 范围 中 进行 查找 


= 
>>> s.rfind('p') # 从 字符 串 尾部 向 前 查找 
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25 

>>> s.index('p') # 返 回首 次 出 现 的 位 置 

和 

>>> s.index('pe') 

6 

>>> 3.index('pear') 

25 

>>> s.index('ppp') # 指 定子 字符 串 不 存在 时 抛 出 异常 
ValusError: sibstring not found 

>>> s.count ('p') # 统 计 子 字符 串 出 现 的 次 数 
5 

>>> 3.00nt ('ppp') # 不 存在 时 返回 0 

0 


742 SNit0、rspit0、partition0 rpartition() 


字符 串 对 象 的 split() 和 rsplit() 方 法 分 别 用 来 以 指定 字符 为 分 隔 符 , 从 字符 串 左 端 
和 右 端 开始 将 其 分 隔 成 多 个 字符 串 ,并 返回 包含 分 隔 结果 的 列表 。 


>>> s= "apple,peach, banana, pear" 

>>> s.split (",") # 使 用 逗号 进行 分 隔 
["apple", "peach", "banana", "pear"] 

>>> 宇 "2014- 10- 31" 


>>>t=s.split("—") # 使 用 指定 字符 作为 分 隔 符 
>>>t 

['2014", '10', '31"] 

>>> list nap (int,t)) # 将 分 隔 结果 转换 为 整数 
[2014,10,31] 


对 于 split() 和 rsplit() 方 法 ,如 果 不 指定 分 隔 符 , 则 字符 串 中 的 任何 空白 符号 (包括 
空格 .换行 符 . 制 表 符 等 ) 的 连续 出 现 都 将 被 认为 是 分 隔 符 ,返回 包含 最 终 分 隔 结果 的 
列表 。 


>>> 5= "hello world \n\n My name is Dong ' 

>>> 3.split() 

['hello', 'world', 'My', name', "is', Dong'] 

>>> = "\n\nhello world \n\nNn My name is Dong " 

>>> s.split () 

[hello ‘world', 'My', ‘name', "is', 'Dong'] 

>>> 5= "\n\nhello\t\t world \n\n\n My name\t is Dong ' 
>>> s.split() 


['hello', world', ‘My', name", 'is', Dong'] 


另外 ,split() 和 rsplit() 方 法 允许 指定 最 大 分 隔 次 数 (注意 ,并 不 是 必须 分 隔 这 人 么 
多 次 ) 。 
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>>> 5= "\n\nhello\t\t world \n\n\n My name is Dong ' 

>>> 3.split traxsplit=1) ## 分 隔 1 次 
[hellov "world \n\n\n My name is Dong '] 

>>> s.rsplit traxsplit=1) 

['\n\nhello\t\t world \n\n\n My name is', 'Dong'] 

>>> s.split (maxsplit= 2) 

['hello', 'world', "My name is Dong '] 

>>> s.rsplit (maxsplit= 2) 

['\n\nhello\t\t world \n\n\n My name', 'is', 'Dong'] 

>>> s.split (raxsplit= 10) # 最 大 分 隔 次 数 可 以 大 于 实际 可 分 隔 次 数 
['hello', "world' My", name', 'is "pong'] 


调用 split() 方 法 如 果 不 传递 任何 参数 ,将 使 用 任何 空白 字符 作为 分 隔 符 , 如 果 字 符 


串 存在 连续 的 空白 字符 ,split() 方 法 将 作为 一 个 空白 字符 对 待 。 但 是 ,明确 传递 参数 指定 
split() 使 用 的 分 隔 符 时 ,情况 略 有 不 同 。 


>>> 'a,, Hb ,coc' .split(', ') # 每 个 逗号 都 被 作为 独立 的 分 隔 符 
oy 

>>> 'a\t\t\thb\t\tooe' .split("\t') # 每 个 制 表 符 都 被 作为 独立 的 分 隔 符 
Ta 

>>> 'aNtN\tENtbbNtNtccc'.split() # 连 续 多 个 制 表 符 被 作为 一 个 分 隔 符 


[av ‘bb', ‘coc'] 


字符 串 对 象 的 partition() 和 rpartition() 方 法 以 指定 字符 串 为 分 隔 符 将 原 字符 串 分 
隔 为 3 部 分 , 即 分 隔 符 之 前 的 字符 串 、 分 隔 符 字 符 串 和 分 隔 符 之 后 的 字符 串 。 如 果 指 定 的 
分 隔 符 不 在 原 字 符 串 中 , 则 返回 原 字 符 串 和 两 个 空 字符 串 。 如 果 字 符 串 中 有 多 个 分 隔 符 ， 
那么 partition() 把 从 左 往 右 遇 到 的 第 一 个 分 隔 符 作 为 分 隔 符 ,rpartition() 把 从 右 往 左 遇 
到 的 第 一 个 分 隔 符 作 为 分 隔 符 。 


>>> = "apple,peach, banana, pear" 


>>> s.partition(', ') # 从 左 侧 使 用 逗号 进行 切 分 
("apple', ', ', ‘peach, banana, pear') 

>>> s.rpartition(', ') # 从 右 侧 使 用 逗号 进行 切 分 
("apple,peach, banana', ', ', 'pear') 

>>> 3.rpartition('banana') # 使 用 字符 串 作 为 分 隔 符 


("apple,peadh, ', "banana', ',pear') 
>>> 'abababab"' .partition('a') 
(wav ‘bababab') 

>>> 'abababab"' .rpartition('a') 
(ababab 'a', 'b') 


743 jon) 


字符 串 的 join 〇 方法 用 来 将 列表 中 多 个 字符 串 进行 连接 ,并 在 相 邻 两 个 字符 串 之 间 
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插入 指定 字符 ,返回 新 字符 串 。 


>>> li= ["apple", "peach", "banana", "pear"] 


>>> sep=", 

>>> sep.join(1i) # 使 用 逗号 作为 连接 符 

>>> ':"'.join(1i) # 使 用 冒号 作为 连接 符 

"apple:peach:bananaspear' 

>>> ''.join(1i) # 使 用 空 字符 作为 连接 符 

"applepeachbananapear 

使 用 split() 和 join() 方 法 可 以 删除 字符 串 中 多 余 的 空白 字符 ,如 果 有 连续 多 个 空白 
字符 ,只 保留 一 个 。 


>>> 一 "aaa bb cde fff | 
>>> ' '.join(x.split()) # 使 用 空格 作为 连接 符 
'aaa Hb c de fff' 
>>> def equavilent (s1,32) : # 判 断 两 个 字符 串 在 Python 意义 上 是 否 等 价 
if sl==s2: 
retum True 
elif ' '.join(sl.split ())==" '.join(s2.split()): 
retum True 
elif ''.join(sl.split())== "''.join(s2.split ()): 
retum True 
else: 
retum False 


>>> equavilent ('pip list', 'pip list') 


? 


>>> equavilent ('[1,2,3]", '[1,2,3]') # 判 断 两 个 列表 写法 是 否 等 价 


>>> equavilent ('[1,2,3]"','[1,2 ,3]') 


? 


>>> equavilent ('[1,2,3]"','[1,2 ,3 ,4]') 
False 


744 lower()、 upper() capitalize(), title()、 swapcase() 


这 几 个 方法 分 别 用 来 将 字符 串 转 换 为 小 写 、 大 写字 符 串 ,将 字符 串 首 字 母 变 为 大 写 ， 
将 每 个 单词 的 首 字 母 变 为 大 写 以 及 大 小 写 互 换 , 生 成 新 字符 串 , 不 对 原 字 符 串 做 任何 
修改 。 

>>> s= "What is Your Neme?n 

>>> s.lower() # 返 回 小 写字 符 串 


mahat is your name?" 
>>> s.upper() # 返 回 大 写字 符 串 
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"WHAT IS YOUR NAME?" 

>>> s-capitalize() # 字 符 串 首 字母 大 写 
"What is your name?' 

>>> stitle() # 每 个 单词 的 首 字母 大 写 
"What Is Your Name?" 

>>> s.swapcase() # 大 小 写 互 换 


replace() .maketrans() \ translate() 
字符 串 方 法 replace() 用 来 蔡 换 字符 串 中 指定 字符 或 子 字符 串 的 所 有 重复 出 现 ,每 次 


只 能 替换 一 个 字符 或 一 个 字符 串 , 把 指定 的 字符 串 参 数 作为 一 个 整体 对 待 ,类 似 于 
Word、WPS. 记 事 本 等 文本 编辑 器 的 查找 与 替换 功能 。 该 方法 并 不 修改 原 字符 串 , 而 是 
返回 一 个 新 字符 串 。 


>>> 于 中国, 中国 " 

>>>print (s.replace(" 中 国 "," 中 华人 民 共 和 国 ")) 
中 华人 民 共 和 国 ,中 华人 民 共 和 国 

>>> print ('abodabc' .replace ('abc', 'ABC')) 
RECdnBC 


字符 串 对 象 的 maketrans() 方 法 用 来 生成 字符 映射 表 , 而 translate() 方 法 用 来 根据 


映射 表 中 定义 的 对 应 关系 转换 字符 串 并 替换 其 中 的 字符 ,使 用 这 两 个 方法 的 组 合 可 以 同 
时 处 理 多 个 不 同 的 字符 ,replace() 方 法 则 无 法 满足 这 一 要 求 。 


# 创 建 映射 表 , 将 字符 "abodef123" 一 一 对 应 地 转换 为 "uvwxyz@ # $5" 
>>> table= '' .maketrans ('abodef123', "uvwxyz@ #$ ') 

>>> = "Python is a greate Programming language. I like it!" 

# 按 映射 表 进 行 替换 

>>> s.translate (table) 


"Python is u gryuty progruming lnguvgy. I liky it!" 


下 面 的 代码 使 用 maketrans() 和 translate() 方 法 实现 了 已 撤 加 密 算法 ,其 中 k 表示 


算法 密 钥 ,也 就 是 把 每 个 英文 字母 变 为 其 后 面 的 第 几 个 字母 。 


>>> import string 

>>> def kaisa(s,k) : 
lower= string.ascii lowercase # 小 写字 母 
Upper= string.ascii uppercase # 大 写字 母 


before= string.ascii letters 

after= lower [k:] + lower[:k] + upper[k:] + upper[:k] 
table= '' makstrans (oefore,after) # 创 建 映射 表 
retumn s.translate (table) 


>>> s= "Python is a greate prograrming language. I like it!™" 
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>>> kaisa(s,3) 
"Sbwlad lv d juhquh surjudpplqj odqjxdjh. L olnh lw!' 

>>> s= 'If the implementation is easy to explain, it may be a good idea." 
>>> kaisa(s,3) 

"Li wkh lpechphqwdwlrq lv hdvb wr hasodlq, lw pdb eh d jrrg lghd." 


746 strip0 rstrip0 strip() 
这 儿 个 方法 分 别 用 来 删除 两 端 . 右 端 或 左 端 连续 的 空白 字符 或 指定 字符 。 


>>>="abc " 

>>> s2- s.strip() # 删 除 空白 字符 

>>> 52 

nabcn 

>>> "nrhello world \n\n' .strip() # 删 除 空白 字符 

"hello world' 

>>> "aaaassdaf".strip (am) # 删 除 指定 字符 

"ssddf™ 

>>> "aaaassdaf".strip (afm) 

asdan 

>>> "aaaassddfaaa" .rstrip("a") # 删除 字符 串 右 端 指定 字符 
"aaaassddf' 

>>> "aaaassddfaaa" .lstrip("a") # 删 除 字符 串 左 端 指定 字符 
'ssddfaaa' 


这 3 个 函数 的 参数 指定 的 字符 串 并 不 作为 一 个 整体 对 待 ,而 是 在 原 字符 串 的 两 侧 、 右 
侧 、 左 侧 删 除 参数 字符 串 中 包含 的 所 有 字符 ,一 层 一 层 地 从 外 往 里 扒 。 


>>> 'aatbcoddeeeffg' .strip('af') # 字 母 £ 不 在 字符 串 两 侧 , 所 以 不 删除 
"bbcoddeeeffg' 

>>> 'aatbcoddeeeffg' .strip('gaf') 

"Hbcoddeee' 

>>> 'aatbcoddeeeffg' .strip('gaef') 

repoodd' 

>>> 'aatbcoddeeeffg' .strip('ghaef') 

‘ody! 

>>> 'aatbcoddeeeffg' .strip('goaefod') 


747 startswith0 .endswith0 


这 两 个 方法 用 来 判断 字符 串 是 否 以 指定 字符 串 开 始 或 结束 ,可 以 接收 两 个 整数 参数 
来 限定 字符 串 的 检测 范围 。 


>>> s= "Beautiful is better than ugly-， 
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>>> 3.startswith('Be') # 检 测 整个 字符 串 
True 
>>> s.startswith('Be',5) # 指 定 检测 范围 的 起 始 位 置 
False 
>>> s.startswith('Be',0,5) # 指 定 检测 范围 的 起 始 和 结束 位 置 
True 


另外 ,这 两 个 方法 还 可 以 接收 一 个 字符 串 元 组 作为 参数 来 表示 前 绷 或 后 级 。 例 如 ,下 
面 的 代码 可 以 列 出 指定 文件 夹 下 所 有 扩展 名 为 bmp jpg 或 gif 的 图 片 。 
>>> ijmport os 


>>> [filename for filename in os.listdir(r'D:\\') if filename.endswith((' .hmp','.jpg','.gif'))] 


748 isanum),isalpha(), isdigit(), isdecimral(), isnumeric()、 isspace()、 
isupper() ,islower() 


这 些 函 数 分 别 用 来 测试 字符 串 是 否 为 数字 或 字母 .是 否 为 字母 .是否 为 数字 字符 、 是 
否 为 空白 字符 ,是否 为 大 写字 母 以 及 是 否 为 小 写字 母 。 


>>> '1234abod' .isalnum() 

True 

>>> '1234abod' .isalpha () # 全 部 为 英文 字母 时 返回 True 
False 

>>> '1234abod' .isdigit () # 全 部 为 数字 时 返回 True 
False 

>>> 'abod' .isalpha() 

True 

>>> '1234.0' .isdigit () 

False 

>>> '1234' .isdigit () 

True 

>>> ' 九 '.isnmeric() # isnumeric() 方 法 支持 汉字 数字 
True 

>>> ' 九 '.isdigit() 

False 

>>> ' 九 '.isdecimal () 

False 

>>> "JW LX '.isdecimal () 

False 

>>>'NV HX'.isdigit() 

False 

>>> 'V EX '.ismmeric() # 支 持 罗 马 数字 


True 
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749 center() ljust() riust0 .zill0 


这 几 个 方法 用 于 对 字符 串 进行 排版 ,其 中 center()、ljust()、rjust() 返 回 指定 宽度 的 
新 字符 串 , 原 字 符 串 居中 、 左 对 齐 或 右 对 齐 出 现在 新 字符 串 中 ,如 果 指 定 的 宽度 大 于 字符 
串 长 度 , 则 使 用 指定 的 字符 (默认 是 空格 ) 进 行 填充 。zfill() 返 回 指定 宽度 的 字符 串 , 在 左 
侧 以 字符 0 进行 填充 。 


>>> 'Hello world!' .oenter (20) # 居 中 对 齐 , 以 空格 进行 填充 
Hello world! 

>>> 'Hello world!' .oenter (20, '=') # 居 中 对 齐 ,以 字符 = 进行 填充 

= W 所 天 用 = 二 二 二 记 

>>> "Hello world!'.1just (20, '=') # 左 对 齐 

"Hello world!========" 

>>> 'Hello world!' .rjust (20, '= ') # 右 对 齐 

'======== Hello world!' 

>>> 'abc' .2fi11 (5) # 在 左 侧 填充 数字 字符 0 

,ooabey 

>>> 'abc' .2fi11 (2) # 指 定 宽度 小 于 字符 串 长 度 时 ,返回 字符 串 本 身 

‘abe' 

>>> "uio'.zfill (20) 

"00000000000000000uio' 


7410 字符 串 对 象 支持 的 运算 符 


Python 支持 使 用 运算 符 “ 十 ”连接 字符 串 , 但 该 运算 符 涉及 大 量 数 据 的 复制 ,效率 非 
常 低 ,不 适合 大 量 长 字符 串 的 连接 。 下 面 的 代码 演示 了 运算 符 “ 十 ”和 字符 串 对 象 join() 
方法 之 间 的 速度 差异 。 


import timeit 


# 使 用 列表 推导 式 生成 10000 个 字符 串 
strlist= [his is a long string that will nct keep in memory.' for n in range (10000)] 


# 使 用 字符 串 对 象 的 join() 方 法 连接 多 个 字符 串 
def use join(): 
retum '… .join(strlist) 


# 使 用 运算 符 “+ "连接 多 个 字符 串 
def use_ plus(): 
result= 
for strtemp in strlist: 
result= result+ strtemp 
retum result 
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“重复 运行 次 数 。 

times= 1000 

jointimer= timeit.Timer ("use join()','fram main _ import use join') 

print ("time for join: ', jointimer.timeit (mniber= times)) 

Plustimer= timeit.Timer('use plus()','frm main _ import use plus') 

Print ("time for plus: ',plustimer.timeit (nnber= times)) 

该 代码 分 别 使 用 join() 函数 和 “十 ”对 10000 个 字符 串 进行 连接 ,并 重复 运行 1000 
次 ,然后 输出 每 种 方法 所 使 用 的 时 间 ,运行 结果 为 


time for join: 0.11133914429192587 
time for Plus: 1.6754796186748913 


修改 上 面 代码 中 的 参数 会 发 现 , 随 着 字符 串 数 量 的 增多 ,运算 符 " 十 "的 效率 会 越 来 越 
低 , 并 且 会 产生 大 量 的 垃圾 数据 ,严重 的 话 会 造成 大 量 内 存 碎片 而 影响 系统 的 运行 。 

另外 ,timeit 模块 还 支持 下 面 代码 演示 的 用 法 ,从 运行 结果 可 以 看 出 , 当 需 要 对 大 量 
数据 进行 类 型 转换 时 ,内 置 函 数 map() 可 以 提供 非常 高 的 效率 。 

>>> import timeit 

>>> timeit.timeit(""- ".join(str (n) for n in range (100)) ', nmiber= 10000) 

# 重 复 运行 10000 次 

0.3063435900577929 

>>> timeit.timeit('- ".join([str (n) for n in range(100)]) vnunber= 10000) 

0.27191914957273866 

>>> timeit.timeit (""- ".join (map (str, range (100))) ', nmiber= 10000) 

0.21119518171659024 


第 2 章 曾经 介绍 过 ,Python 字符 串 支持 与 整数 的 乘法 运算 ,表示 序列 重复 ,也 就 是 字 
符 串 内 容 的 重复 。 

>>> 'abod'* 3 

"abcdabcdabcd' 

最 后 ,与 列表 ,元 组 .字典 集合 一 样 ,也 可 以 使 用 成 员 测 试 运算 符 in 来 判断 一 个 字符 
串 是 否 出 现在 另 一 个 字符 串 中 ,返回 True 或 False。 





>>> "a" in "abode" # 测 试 一 个 字符 中 是 否 存在 于 另 一 个 字符 串 中 
True 

>>> 'ac' in 'abode' # 关 键 字 im 左边 的 字符 串 作 为 一 个 整体 对 待 
False 


>>> "j" not in "abode" 

True 

几乎 所 有 论坛 或 社区 都 会 对 用 户 提交 的 输入 进行 检查 ,并 过 滤 一 些 非法 的 敏感 词 ,这 
极 大 地 促进 了 网 络 文明 和 净化 。 这 样 的 功能 可 以 使 用 关键 字 in 和 replace() 方 法 来 实现 。 
下 面 的 代码 用 来 检测 用 户 输入 中 是 否 有 不 允许 的 敏感 字 词 ,如 果 有 就 提示 非法 。 
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>>>words= (测试 ,非法 "暴力 
>>>text= input(" 请 输入 : ') 
请 输入 : 这 句 话 里 含有 非法 内 容 
>>> for word in words: 

if word in text: 


print(' 非 法 ') 
break 
else: 
print(' 正 常 ') 


下 面 的 代码 则 可 以 用 来 测试 用 户 输入 中 是 否 有 敏感 词 , 如 果 有 就 把 敏感 词 蔡 换 为 3 
个 星 号 * x* x*。 
>>>words= ("测试 ',' 非 法 ',' 暴 力 ',' 话 ') 
>>> text= ' 这 句 话 里 含有 非法 内 容 ' 
>>> for word in words: 
if word in text: 
text= text .replace (word,' * * 关中 
>>> text 


' 这 句 * * * 里 含有 * * * 内 容 ， 
或 者 直接 使 用 正则 表达 式 模 块 re 提供 的 函数 进行 检查 和 过 滤 : 


>>> words= ("测试 ',' 非 法 ',' 暴 力 ',' 话 ') 
>>> text= ' 这 人 句 话 里 含有 非法 内 容 ' 

>>> import re 

>>> re.sub('|'.join(words),'* # 关 ',text) 


,这 句 * x * 里 含有 * * x 内 容 ， 


7411 适用 于 字符 串 对 象 的 内 置 函 数 
除了 字符 串 对 象 提供 的 方法 以 外 ,很 多 Python 内 置 函 数 也 可 以 对 字符 串 进行 操作 。 


>>> 六 "Hello world. 


>>> len (x) # 字 符 串 长 度 

12 

>>> max (x) # 最 大 字符 

ww 

>>>min(x) 

>>> list (zip(x,2x)) #zip() 也 可 以 作用 于 字符 串 


emt en (Ch to Vw Con 
Wa 
>>> sorted (x) 





[Hd eo on, rr wr] 
>>> list (reversed (x)) 





166 bz Python 程序 设计 基础 (第 2 版 ) 


S 


>>> list (enumerate (x)) 

[(0,'H'), (1,e'), (2,°1), (3,°1°), (4,'0), (5,° '), (6,'w), (7,'0'), (8,° 
jr(9r "Ly (0 dD) (lle "= "3 

>>> list (map (lanbda i,j: i+j,x,x)) 

['HH','ee', 11 1 oo ww oo rr, 1, da] 


内 首 函 数 eval() 用 来 把 任意 字符 串 转 化 为 Python 表达 式 并 进行 求 值 。 


>>> eval ("3+ 4") # 计 算 表达 式 的 值 

7 

>>> 二 3 

>>>br5 

>>> eval (‘at b') # 这 时 要 求 变量 a 和 b 已 存在 
8 

>>> import math 

>>> eval (‘math.scgt (3) ') 

1.7320508075688772 


在 Python 3.x 中 ,input() 将 用 户 的 输入 一 律 按 字 符 串 对 待 , 如 果 需 要 将 其 还 原 为 本 
来 的 类 型 ,对 于 简单 的 整数 .实数 .复数 可 以 直接 使 用 int() ,float() 和 complex() 函 数 进 
行 转换 ,而 对 于 列表 、 元 组 或 其 他 复杂 结构 则 需要 使 用 内 置 函 数 eval() ,不 能 使 用 list()、 
tuple() 直 接 进行 转换 。 不 管 是 使 用 int() ,float() 和 complex() 函 数 还 是 eval() 函数 ,在 
转换 时 最 好 配合 异常 处 理 结构 ,以 避免 因为 数据 类 型 不 符合 要 求 或 者 无 法 正确 求 值 而 抛 
出 异常 。 


>>>z input () 


>>> eval (x) 

357 

>>> 三 input () 

[3,5,7] 

>>>x 

"[3,5,7]" 

>>> eval (x) # 注 意 ,这 里 不 能 使 用 list (x) 进 行 转换 
[3,5,7] 

>>>= input() 


>>> try: # 当 前 作用 域 中 不 存在 变量 abc 
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Print (‘wrong input') 


wrong input 

Python 的 内 置 函 数 eval() 可 以 计算 任意 合法 表达 式 的 值 ,如 果 有 恶意 用 户 巧 妙 地 构 
造 并 输入 非法 字符 串 ,可 以 执行 任意 外 部 程序 或 者 实现 其 他 目的 ,例如 ,下 面 的 代码 运行 
后 可 以 启动 记事 本 程序 : 

>>> a input ('Please input a value:') 

Please input a value: _import _('os').startfile(r'C:\Windows\\notepad.exe') 

>>> eval (a) 

下 面 的 代码 则 会 导致 屏幕 一 闪 ,瞬间 在 当前 文件 夹 中 创建 了 一 个 子 文件 夹 testtest: 

>>>eval(" _import _('os').system('md testtest')") 

所 以 ,如 果 程 序 中 有 使 用 内 置 函数 eval() 对 用 户 输入 的 字符 串 求 值 的 代码 ,一 定 要 检 
查 用 户 输 入 的 字符 串 中 是 否 有 危险 的 字符 串 并 对 这 些 特殊 的 字符 串 进行 必要 的 过 滤 , 如 
"”_import__('0s)." ,否则 就 很 容易 引发 很 多 安全 问题 。 当 然 , 也 可 以 使 用 标准 库 ast 提 
供 的 安全 函数 literal_eval() 。 


741t2 字符 串 对 象 的 切片 操作 
切片 也 适用 于 字符 串 , 但 仅 限于 读 取 其 中 的 元 素 ,不 支持 字符 串 修改 。 


>>> 'Explicit is better than implicit.'[:8] 
‘Eplicit' 

>>> 'Explicit is better than implicit.'[9:23] 
"is better than’ 

>>> path= 'C:\ \Python35\ \test.bp' 

>>> path[:- 4] + '_new' +path[- 4:] 
'C:\\Python35\ \test_new.hmp’ 


7.5 字符 串 常量 


Python 标准 库 string 提供 了 英文 字母 大 小 写 .数字 字符 、 标 点 符号 等 常量 ,可 以 直接 
使 用 。 下 面 的 代码 实现 了 随机 密码 生成 功能 。 


>>> jimport string 
>>> 六 string.digits + string.ascii letters + string.punctuation 

# 可 能 的 字符 集 
>>>x 


'0123456789abodefghijklrmmopqrstuvwxyzABCDEFGHIJKIMNOPQRSTUVWXYZ!"#$S&E\"'()¥*+,— ./:;<=>?@ [\]~ ~ 
人 

>>> import randcom 

>>> def generatestrongPwd( : # 生 成 指定 长 度 的 随机 密码 字符 串 
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retum ''.join( (randem.choioe (x) for i in range(W))) 
>>> generateStrongPwd (8) #8 位 随机 密码 
'@ < TRS i' 
>>> generateStrongPwd (8) 
'O.u:E+t lv' 
>>> generateStrongPwd (15) #15 位 随机 密码 


olox TGwi.u..e/' 


7.6 中 英文 分 词 


如 果 字 符 串 中 有 连续 的 英文 和 中 文 , 可 以 根据 字符 串 的 规律 自己 编写 代码 将 其 切 分 。 
六 ' 狗 dog 猫 cat 杯 子 cp 桌子 table 你 好 ' 


= 
= 
棋 闻 
for ch in xs # 先 提取 英文 
if 'a'<=ch<='z' or 'A'<=dK= "2": 
t+=ch 
elif t: 
e.append (t) 
和 
if t: 
e.append (t) 
活 她 


for ch in x: # 再 提取 中 文 
if 0x4e00<= ord(ch)j<= 0x9fa5: # 基 本 汉字 Unicode 编码 范围 
上 += 中 
elif t: 
c.append (t) 
t=" 
ift: 
c.atpend (t) 
tv 


Print (c) 
Print (e) 


Python 扩展 库 jieba 和 snownlp 很 好 地 支持 了 中 英文 分 词 ,可 以 使 用 pip 命令 进行 
安装 。 在 自然 语言 处 理 领域 经 常 需要 对 文字 进行 分 词 ,分词 的 准确 度 直接 影响 后 续 文本 
处 理 和 挖掘 算法 的 最 终 效 果 。 


>>> import jieba # 导 入 jisba 模 块 
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>>> 六 "分词 的 准确 度 直接 影响 了 后 续 文 本 处 理 和 挖掘 算法 的 最 终 效果 。 


>>> jisba.ott 四 # 使 用 默认 词 库 进行 分 词 
< generator abject Tokenizer.cut at OQx000000000342C990> 

>>> 1ist( ) 

[分 词 …' 的 … "准确 度 … 直接 "影响 "了 "上 后续, 文本 处 理 ,' 和 "… "挖掘 "， "算法 …' 的 最终. 
效果 "I 

>>> list jieba.cout ("纸杯 ')) 

[' 纸 杯 '] 

>>> list jieba.cut (' 花 纸杯 ')) 

[' 花 ','" 纸 杯 '] 

>>> jisba.add word(' 花 纸杯 ') # 增 加 词 条 

>>> list Gisba.cut(' 花 纸杯 ')) # 使 用 新 词 库 进 行 分 词 

[' 花 纸杯 '] 

>>> import snownlp # 导 入 snownlp 模 块 


>>> sncownlp.SnowNLP(" 学 而 时 习 之 ,不 亦 说 乎 ') .words 

[学 而 "时 习 … "之 不 亦 "… "说 乎 9 

>>> snownlp.SnowNLP (x) .words 

[人 分词" 的 "准确 度 … 直接" "影响 "了 "后 续 "， 文本" 处理 "和 '" "挖掘 ", "算法 "的 ,' 最 终 
5 激 果 5 站 


7.7 ”汉字 到 拼音 的 转换 


Python 扩展 库 pypinyin 支持 汉字 到 拼音 的 转换 ,并 且 可 以 和 分 词 扩展 库 配合 使 用 。 


>>> fram pypinyin jmport lazy pinyin,pinyin 


>>> lazy_pinyin(' 董 付 国 ') # 返 回 拼音 

["dong 'fu', 'guo'] 

>>> lazy_pinyin(' 董 付 国 ',1) # 带 声调 的 拼音 

['Bng', fi ,gD'] 

>>> lazy pinyin(" 董 付 国 "23 # 另 一 种 拼音 形式 ,数字 表示 前 面 字母 的 声调 
["do3ng'， "fu4' 'guo2'] 

>>> lazy_pinyin(' 董 付 国 ',3) # 只 返回 拼音 首 字母 

[L'ad', fF','g'] 

>>> lazy_pinyin(' 重 要 ',1) # 能 够 根据 词组 智能 识别 多 音字 

[zhbpng 'yio'] 

>>> lazy pinyin(' 重 阳 ',]) 

['dpng', 'ying'] 

>>>pinyin(' 重 阳 ') # 返 回 拼音 

[[chong'],["Ying'"]] 

>>>pinyin(' 重 阳 节 ',heteronym= True) # 返 回 多 音字 的 所 有 读音 

[['zhbng' "chbpng' "Hng'], ['ying'], ("jié",'jie"]] 

>>> import jisba # 其 实 不 需要 导入 jisba, 这 里 只 是 说 明 已 安装 


>>> 关 "中 英文 混合 test123" 
>>> lazy pinyin (x) # 自 动 调用 已 安装 的 jisba 扩 展 库 分 词 功能 
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[rzhong'v "ying' wen', hun', "he' "test123'] 
>>> lazy pinyin (ieba.cut (x)) 

[zhong'v ‘ying", wen', ‘hun', "he' "test123'] 

>>> 六 山东 烟台 的 大 樱桃 真 好 吃 啊 ' 

>>> sorted (x,key= lanbda ch: lazy pinyin(ch)) 。 # 按 拼音 对 汉字 进行 排序 
[ 啊 ， 吃 … 大 … 的 六 东 … 好 洲 山 …… 台 … 桃 烟 愤 … 真 ]] 


7.8 精彩 案例 赏析 


示例 7-1 编写 函数 实现 字符 串 加 密 和 解密 ,循环 使 用 指定 密 钥 ,采用 简单 的 异 或 
算法 。 
Gef crypt (source key) : 
fram itertools import cycle 
i 
temr cycle (key) 
for ch in source: 
result= result + chr (ord(ch) ~ ord (next (terp))) 
retum result 


Souroe= "Shandong Institute of Business and Tedhnology’ 
key= 'Dong Fuguo'" 


Print ('Before Encrypted:'+ source) 
encrypted crypt (source, key) 

Print ('After Encrypted: '+ encrypted) 
ecrypted= crypt (encrypted, key) 
Print ('After Decrypted: "+ decrypted) 
输出 结果 如 图 7-2 所 示 。 


Before Encrypted; Shandong Institute of Business and "a Tog 
After Encrypted:1et = D)~ Uh#-PT3 1U “0,1S/~ 
After Decrypted: Shandong Institute of Business a edd olds 


图 7-2 字符 串 加 密 与 解密 结果 


示例 7-2 编写 程序 ,生成 大 量 随机 信息 。 

本 例 代码 演示 了 如 何 使 用 Python 标准 库 random 来 生成 随机 数据 ,这 在 需要 获取 大 
量 数据 来 测试 或 演示 软件 功能 时 非常 有 用 ,不 仅 能 真实 展示 软件 的 功能 或 算法 ,还 可 以 避 
免 泄露 真实 数据 引起 不 必要 的 争议 。 

人 rom randcm import choios, randint 

inmport string 


import codecs 


# 常 用 汉字 Unicode 编码 表 部 分 ), 完 整 列表 详 见 配 套 源 代码 
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StringBase= '\u7684\u4e00\u4e86\u662f\u6211\u4e0dN\u5728\u4eba' 


def getpmail () : 
# 常 见 域名 后 级 ,可 以 随意 扩展 该 列表 
Suffix= [' .om', '.org', ' .net', '.cn'] 
characters= string.ascii letterst string.digitst ' ' 
Username= '' .join ( (choioe (characters) for i in range (randint (6,12)))) 
domainr= '' .join( (choioe (characters) for i in range (randint (3,6)))) 
retum usernamet '@ '+ domaint choice (suffix) 





Gef getTelNo(): 
retum '' .join( (str (randint (0,9)) for i in range (11))) 


def getNameOrAcdress (flag) : 

'"'flag=1 表 示 返 回 随机 姓名 ,flag= 0 表示 返回 随机 地 址 '"' 
证 日 ag==1: 

# 大 部 分 中 国人 姓名 为 2~ 5 个 汉字 

rangestart, rangeend= 2,5 
elif flag==0: 

# 假 设 地 址 在 10~ 30 个 汉字 之 间 

rangestart, rangeend= 10, 30 
IE "' .join( Ghoioe BtringPaee) for i in range (mandint (rangestart, rargeerd)))) 
retum result 


def getSex(): 
retum choice((' 男 ',' 女 ')) 


Gef getage(): 
retum str (randint (18, 100)) 


def main (filename) : 
with codecs.cpen (filename, 'w', 'utf-— 8') as fp: 
fp.write ('Name, Sex, Age, TelNO, cdress, Erail\n') 
# 随 机 生成 200 个 人 的 信息 
for i in range(200) : 
name= getNameOrPcdress (1) 
sex getSex() 
ager gethge() 
tel= getTelNo() 
adiress— getNameOrAddress (0) 
email= getErail () 
line= ', ' .join( [name, sex,age, tel,address,email]) + '\n' 
fp-write (line) 
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def cutput (filename) : 
with codecs.open (filename, 'r', "utf- 8') as ff: 
for line in fp: 
line= line.split (',") 
for i in line: 


示例 7-3 检查 并 判断 密码 字符 串 的 安全 强度 。 
import string 


Gef check (pwd) : 
# 密 码 必须 至 少 包含 6 个 字符 
if not isinstance (pwd, str) or len(pwd)< 6: 
retum "not suitable for password' 


# 密 码 强度 等 级 与 包含 字符 种 类 的 对 应 关系 

d= {1: 'weak',2: ‘below middle', 3: 'above middle',4:'strong'} 

# 分 别 用 来 标记 pd 是 否 含有 数字 、 小 写字 母 . 大 写字 母 和 指定 的 标点 符号 
= [False]*4 


for ch in pwd: 
# 是 否 包含 数字 
if not r[0] and ch in string.digits: 
I[0]=True 
# 是 否 包含 小 写字 母 
elif not r[1] and ch in string.ascii lowercase: 
r[1]= True 
# 是 否 包含 大 写字 母 
elif not r[2] and ch in string.ascii uppercase: 
r[2]= True 
# 是 否 包含 指定 的 标点 符号 
elif not r[3] and ch in .432<> 
r[3]= mue 
# 统 计 包含 的 字符 种 类 ,返回 密码 强度 
retum d.get (r.count (True), 'error') 


Print (check ("a2cd, ')) 
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本 章 小 结 


(1) 字符 串 属于 Python 不 可 变 序列 ,其 所 有 涉及 修改 内 容 的 方法 都 是 返回 一 个 新 字 
符 串 。 

(2) 字符 串 属于 Python 有 序 序列 ,支持 使 用 下 标 访问 其 中 的 字符 ,支持 双向 索引 ，, 支 
持 切 片 操作 。 

(3) 字符 串 可 以 使 用 encode() 方 法 转换 为 字 节 串 , 字 节 串 可 以 使 用 decode() 方 法 转 
换 为 字符 串 。 

(4) GB2312、GBK、CP936 都 使 用 2B( 字 节 ) 表 示 一 个 汉字 ,UTF-8 使 用 3B 表示 一 个 
汉字 。 

(5) Python 3. x 支持 使 用 中 文 作为 标识 符 。 

(6) 在 字符 串 前 加 字母 r 或 R 表示 原始 字符 串 , 其 中 的 所 有 字符 都 表示 原始 的 含义 
而 不 会 进行 任何 转 义 。 

(7) 除了 字符 串 本 身 提 供 的 大 量 功能 强大 的 方法 之 外 ,还 有 很 多 Python 运算 符 和 内 
告 函 数 也 支持 对 字符 串 的 操作 。 


习 题 


7.1 假设 有 一 段 英文 ,其 中 有 单独 的 字母 I 误 写 为 i, 请 编写 程序 进行 纠正 。 
7.2 假设 有 一 段 英文 ,其 中 有 单词 中 间 的 字母 i 误 写 为 1, 请 编写 程序 进行 纠正 。 
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正则 表达 式 是 字符 串 处 理 的 有 力 工具 。 它 使 用 预定 义 的 模式 去 匹配 一 类 具有 共同 特 
征 的 字符 串 , 可 以 快速 .准确 地 完成 复杂 的 查找 、 蔡 换 等 处 理 要 求 , 比 字符 串 自 身 提 供 的 方 
法 提供 了 更 强大 的 处 理 功能 。 例 如 ,使 用 字符 串 对 象 的 split() 方 法 只 能 指定 一 个 分 隔 
符 ,而 使 用 正则 表达 式 可 以 很 方便 地 指定 多 个 符号 作为 分 隔 符 ;使 用 字符 串 对 象 的 split() 
并 指定 分 隔 符 时 ,很 难处 理 分 隔 符 连 续 多 次 出 现 的 情况 ,而 正则 表达 式 让 这 一 切 都 变 得 非 
常 轻松 。 


8.1 正则 表达 式 语法 


811 正则 表达 式 基本 语法 

正则 表达 式 由 元 字符 及 其 不 同 组 合 构成 ,通过 巧妙 地 构造 正则 表达 式 可 以 匹配 任意 
字符 串 , 完 成 查找 替换 等 复杂 的 字符 串 处 理 任务 。 常 用 的 正则 表达 式 元 字符 如 表 8-1 
所 示 。 

表 8-1 常用 的 正则 表达 式 元 字符 
元 字符 功能 说 明 

匹配 除 换行 符 以 外 的 任意 单个 字符 
# 匹配 位 于 * 之 前 的 字符 或 子 模式 的 0 次 或 多 次 出 现 
+ 匹配 位 于 十 之 前 的 字符 或 子 模式 的 1 次 或 多 次 出 现 
一 在 [] 之 内 用 来 表示 范围 
匹配 位 于 | 之 前 或 之 后 的 字符 
各 匹配 以 ^ 后 面 的 字符 或 模式 开头 的 字符 串 
$ 匹配 以 $ 前面 的 字符 或 模式 结束 的 字符 串 


匹配 位 于 “?” 之 前 的 0 个 或 1 个 字符 或 子 模式 , 即 问号 之 前 的 字符 或 子 模式 是 可 选 的 。 
紧 随 任何 其 他 限定 符 (* ,十 ,?、{n}、{n,}、{n,m)) 之 后 时 ,表示 “ 非 贪 心 ” 匹 配 模式 。 
“ 非 贪心 ”模式 匹配 尽 可 能 短 的 字符 串 ,而 默认 的 “贪心 "模式 匹配 尽 可 能 长 的 字符 串 。 
例如 ,在 字符 串 "oooo" 中 ,“o 十 ?” 只 匹配 单个 o, 而 o 十 匹配 所 有 o 
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续 表 
元 字符 功能 说 明 
\ 表示 位 于 \ 之 后 的 为 转 义 字符 
此 处 的 num 是 一 个 正 整 数 ,表示 前 面 字符 或 子 模 式 的 编号 。 例 如 ,“(. )\1? 匹 配 两 个 连 
续 的 相同 字符 
NE 匹配 一 个 换 页 符 
\n 匹配 一 个 换行 符 
\r 匹配 一 个 回 车 符 
\b 匹配 单词 头 或 单词 尾 
\B 与 \b 含义 相反 
\d 匹配 任何 数字 ,相当 于 [0-9] 
\D 与 \d 含义 相反 ,相当 于 [^0-9] 
\s 匹配 任何 空白 字符 ,包括 空格 、 制 表 符 、 换 页 符 ,与 [ \f\n\r\t\v] 等 效 
\S 与 \s 含义 相反 
\w 匹配 任何 字母 .数字 以 及 下 夯 线 ,相当 于 [a-zA-Z0-9_] 
\W 与 \w 含义 相反 ,与 [^A-Za-z0-9_] 等 效 
63 将 位 于 () 内 的 内 容 作为 一 个 整体 来 对 待 
人 按 {} 中 指定 的 次 数 进行 匹配 ,例如 ,{3,8} 表 示 前 面 的 字符 或 模式 至 少 重复 3 次 而 最 多 
重复 8 次 
口 匹配 位 于 [] 中 的 任意 一 个 字符 
[^xyz] ^ 放 在 口内 表示 反 向 字符 集 , 匹 配 除 x、y、z 之 外 的 任何 字符 
[a-z] 字符 范围 ,匹配 指定 范围 内 的 任何 字符 
[a-z] 反 向 范围 字符 ,匹配 除 小 写 英文 字母 之 外 的 任何 字符 








如 果 以 \ 开 头 的 元 字符 与 转 义 字符 相同 , 则 需要 使 用 \\, 或 者 使 用 原始 字符 串 。 在 字 
符 串 前 加 上 字符 r 或 R 之 后 表示 原始 字符 串 , 字 符 串 中 任意 字符 都 不 再 进行 转 义 。 原 始 
字符 串 可 以 减少 用 户 的 输入 ,主要 用 于 正则 表达 式 和 文件 路 径 字 符 串 的 情况 ,但 如 果 字 符 
串 以 一 个 斜 线 \ 结 束 , 则 需要 多 写 一 个 斜 线 , 即 以 \\ 结 束 。 


812 正则 表达 式 扩展 语法 


正则 表达 式 使 用 圆 括号 ”()” 表 示 一 个 子 模式 , 圆 括号 内 的 内 容 作为 一 个 整体 对 待 。 
例如 ,"(red) 十 可 以 匹配 redred'\'redredred' 等 一 个 或 多 个 重复 red' 的 情况 。 使 用 子 模式 扩 
展 语法 可 以 实现 更 加 复杂 的 字符 串 处 理 功 能 .常用 的 扩展 语法 如 表 8-2 所 示 。 





176 8 




















Python 程序 设计 基础 (第 2 版) 
SS 
表 8-2 常用 的 子 模式 扩展 语法 
语 法 功能 说 明 
(7?P<groupname>) 为 子 模式 命名 
(TiLmsux) 设置 匹配 标志 ,可 以 是 几 个 字母 的 组 合 , 每 个 字母 含义 与 编译 标志 相同 
(?:…) 匹配 但 不 捕获 该 匹配 的 子 表达 式 
(?P=groupname) 表示 在 此 之 前 的 命名 为 groupname 的 子 模式 
(?#…*) 表示 注释 





用 于 正则 表达 式 之 前 ,如 果 雪 一 后 的 内 容 在 字符 串 中 出 现 则 匹配 ,但 不 返 








I 回 二 = 之 后 的 内 容 

PR 用 于 正则 表达 式 之 后 ,如 果 二 后 的 内 容 在 字符 囊 中 出 现 则 匹配 ,但 不 返回 
. 二 之 后 的 内 容 

ee 用 于 正则 表达 式 之 前 ,如 果 志 ! 后 的 内 容 在 字符 串 中 不 出 现 则 匹配 ,但 不 


返回 二! 之 后 的 内 容 








用 于 正则 表达 式 之 后 ,如 果 “!” 后 的 内 容 在 字符 串 中 不 出 现 则 匹配 ,但 不 
返回 “1” 之 后 的 内 容 


813 正则 表达 式 集锦 


正则 表达 式 语法 博大 精深 ,很 难 一 下 子 全 都 记 住 ,建议 在 了 解 基本 语法 的 基础 上 , 记 
住 一 些 常 用 的 写法 ,然后 在 实际 应 用 中 不 断 深入 。 

(1) 最 简单 的 正则 表达 式 是 普通 字符 串 , 只 能 匹配 自身 。 

(2) 人 pjc]jython 可 以 匹配 python'\jython'vcython'。 


(3) fa-zA-Z0-9] 可 以 匹配 一 个 任意 大 小 写 


字母 或 数字 。 


(4) 人 abc] 可 以 一 个 匹配 任意 除 a'b'\c 之 外 的 字符 。 
(5) python|perl 或 p(ython|erl) 都 可 以 匹配 python 或 perl'。 


(6) r'(http://)? (www\.)? python\. org's 


只 能 匹配 'http://www. python. org'、 


http://python. org' www. python. org' 和 Il'python. org'。 
(7) "http' 只 能 匹配 所 有 以 http' 开 头 的 字符 串 。 


(8) (pattern) * : 


允许 模式 重复 0 次 或 多 次 。 


(9) (pattern) 十 : 允许 模式 重复 一 次 或 多 次 。 


(10) (pattern) {m,n)} 
da 


(12) ab{1 
符 串 。 


: 允许 模式 重复 m~m 次 ,注意 逗号 后 面 不 要 有 空格 。 


匹配 多 个 (包含 0 个 )a 或 b, 后 面 紧 跟 一 个 字母 c。 
': 等 价 于 'ab 十 "匹配 以 字母 a 开头 后 面 紧 跟 一 个 或 多 个 字母 b 的 字 


(13)“[a-zA-Z]{1}([a-zA-Z0-9. _]){4,19}$': 匹配 长 度 为 5 一 20 的 字符 串 ,必须 以 


字母 开头 并 且 后 面 可 带 数字 


\ 字 母 “_”. ”的 字符 串 。 


(14)“(\w){6,20}$': 匹配 长 度 为 6 一 20 的 字符 串 ,可 以 包含 字母 ,数字 、 下 面 线 。 
(15) "d{1,3}\.\d{1,3}\. \d{1,3})\. \d{1,3}$'; 检查 给 定 字符 串 是 否 为 合法 IP 
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地 址 。 

(16) “(13[4-9]\d{8})1(15[01289]\d{8)) $': 检查 给 定 字 符 串 是 否 为 移动 手机 
号 码 。 
(17)"[a-zA-Z] 十 $': 检查 给 定 字 符 串 是 否 只 包含 英文 大 小 写字 母 。 

(18) "\w 十 @(C\w 十 \. ) 十 \w 十 $': 检查 给 定 字符 串 是 否 为 合法 电子 邮件 地 址 。 
(19) “QO-)?\d 十 (\. \d{1,2))?$'; 检查 给 定 字符 串 是 否 为 最 多 带 有 2 位 小 数 的 正 数 
或 负数 。 

(20) (Nu4e00-\u9fa5]': 匹配 给 定 字 符 串 中 的 常用 汉字 。 

(21) "\d{18)|\d{15)$'; 检查 给 定 字符 串 是 否 为 合法 身份 证 格式 。 

(22) \d{4)-\d{1,2)-\d{1,2)': 匹配 指定 格式 的 日 期 ,如 2017-3-30。 

(23) "(7?=, * [a-z])(?=. * [A-Z]))(?=. * \d)(?=. *[,._]). {8,}$'; 检查 给 定 
字符 串 是 否 为 强 密 码 ,必须 同时 包含 英语 字母 大 写字 母 .英文 小 写字 母 ,数字 或 特殊 符号 
(如 英文 逗号 .英文 句号 、 下 夯 线 ) ,并 且 长 度 必 须 至 少 8 位 。 

(24) "(?!1.x[AA"AA 一 %?]). 十 ": 如 果 给 定 字 符 串 中 包含 、"、/、;、 二 =、% 和 “7?” 则 匹 
配 失败 ,关于 子 模式 语法 请 参考 表 5-4。 

(25) .NN1 十 '; 匹配 任意 字符 或 模式 的 一 次 或 多 次 重复 出 现 。 

(26) ((?P 一 [全 \b\w 十 \b)Ns 十 (?P 王 人 D)": 匹配 连续 出 现 两 次 的 单词 。 

(27) ((?P<<f 人 >. )(?P=f)(?P 二 g 记 . )(?P 一 g))': 匹配 AABB 形式 的 成 语 或 字母 
组 合 。 
使 用 时 要 注意 的 是 ,正则 表达 式 只 是 进行 形式 上 的 检查 ,并 不 保证 内 容 一 定 正确 。 例 
如 上 面 的 例子 中 ,正则 表达 式 人 \d{1,3).N\dll.3)N.NAdll,3 人 .Ndf1,3}$ 可 以 检查 字符 
串 是 否 为 IP 地 址 ,字符 串 888. 888. 888. 888' 这 样 的 也 能 通过 检查 ,但 实际 上 并 不 是 有 效 
的 IP 地址 。 同 样 的 道理 ,正则 表达 式 "\d{18)|\d{15)}$' 也 只 负责 检查 字符 串 是 否 为 18 
位 或 15 位 数字 ,并 不 保证 一 定 是 合法 的 身份 证 号 。 


8.2 直接 使 用 正则 表达 式 模块 re 处 理 字符 串 


Python 标准 库 re 提供 了 正则 表达 式 操作 所 需要 的 功能 , 既 可 以 直接 使 用 re 模块 中 
的 方法 ( 见 表 8-3) 处 理 字符 串 ,也 可 以 把 模式 编译 成 正则 表达 式 对 象 再 使 用 ( 见 8. 3 节 ) 。 


表 8-3 re 模块 中 的 方法 




















方 ”法 功能 说 明 
compile(pattern[ , flags]) 创建 模式 对 象 
escape(string) 将 字符 串 中 所 有 特殊 正则 表达 式 字符 转 义 
findall(pattern, string[, flags]) 列 出 字符 串 中 模式 的 所 有 匹配 项 
5 区 返回 包含 所 有 匹配 项 的 迭代 对 象 ,其 中 每 个 匹配 项 都 是 
finditer(pattern, string, flags=0) 
match 对 象 
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续 表 





方法 


功能 说 明 





fullmatch( pattern, string, flags=0) 


尝试 把 模式 作用 于 整个 字符 串 ,返回 match 对 象 或 None 





match(pattern, string[ , flags]) 


从 字符 串 的 开始 处 匹配 模式 ,返回 match 对 象 或 None 











purge() 清空 正则 表达 式 缓存 
search(pattern, string[, flags]) 在 整个 字符 串 中 寻找 模式 ,返回 match 对 象 或 None 
split(pattern，string[，maxsplit 二 0]) | 根据 模式 匹配 项 分 隔 字符 串 





sub(pat, repl, string[, count=0]) 


将 字符 串 中 所 有 pat 的 匹配 项 用 repl 替换 ,返回 新 字符 串 ， 
repl 可 以 是 字符 串 或 返回 字符 串 的 可 调用 对 象 ,该 可 调用 对 
象 作用 于 每 个 匹配 的 match 对 象 





subn(pat, repl, string[, count=0]) 





将 字符 串 中 所 有 pat 的 匹配 项 用 repl 替换 ,返回 包含 新 字符 
串 和 替换 次 数 的 二 元 组 ,repl 可 以 是 字符 串 或 返回 字符 串 的 
可 调用 对 象 ,该 可 调用 对 象 作用 于 每 个 匹配 的 match 对 象 


其 中 函数 参数 flags 的 值 可 以 是 re. 工 注意 是 大 写字 母 TI, 不 是 数字 1, 表 示 忽 略 大 小 
写 ) ,re. L( 支 持 本 地 字符 集 的 字符 ) 、re. M( 多 行 匹配 模式 ) ,re. S( 使 元 字符 “. ”匹配 任意 
字符 ,包括 换行 符 )、re. U( 匹 配 Unicode 字符 ) ,re.X( 忽 略 模式 中 的 空格 ,并 可 以 使 用 井 
注释 ) 的 不 同 组 合 (使 用 | 进行 组 合 ) 。 

下 面 的 代码 演示 了 直接 使 用 re 模块 中 的 方法 和 正则 表达 式 处 理 字 符 串 的 用 法 ,其 中 
match() 函 数 用 于 在 字符 串 开 始 位 置 进行 匹配 ,而 search() 函数 用 于 在 整个 字符 串 中 进行 
匹配 ,这 两 个 函数 如 果 匹 配 成 功 则 返回 match 对 象 , 否 则 返回 None。 


>>> jimport re 


>>> text= 'alpha. beta… garma delta' 


>>> re.split('[\. ]+ ',text) 
[alghav ‘beta', gammav 'delta'] 


>>> re.split('[\. ]+ ',text,maxsplit=2) 


[alhav ‘beta', "gamma delta'] 


>>> re.split('[\. ]+ ',text,maxsplit=1) 


["alpha', "beta… gamma delta'] 
>>>pat= '[a- zA- 2]+" 

>>> re.findall (pat, text) 
["alpha' "beta', 'garma', 'delta'] 
>>> pat= ' {name}" 

>>> text= 'Dear {name}j… 

>>> re.sub (pat, 'Mr.Dong', text) 
‘Dear Mr.Dong…， 
>>>s='asd’ 

>>> re.sub('alsld', 'good',s) 
"good good good ' 


>>> s="It's a very good good idea" 


# 导 入 re 模块 
# 测 试用 的 字符 串 
# 使 用 指定 字符 作为 分 隔 符 进行 分 隔 


# 最 多 分 隔 2 次 


# 最 多 分 隔 1 次 


# 查 找 所 有 单词 


# 字 符 串 替换 


# 字 符 串 替换 





第 8 章 文本 处 理 ( 二 ): 正则 表达 式 向 179 
® 


>>> re.sib(r' (\b\wt ) \1',r"\1',s) # 处 理 连续 的 重复 单词 
"It's a very good idean 
>>> re.sdb (avlanbda x:x.group (0) .upper () , 'aaa abc abde') 

# repl 为 可 调用 对 象 
'RRR Rbc Abde' 
>>> re.sub(' [a- z] ', lanbda x:x.group (0) -upper (), 'aaa abc abde ) 


'AAA REC REDE' 
>>> re.sub(' [a- zR- z]' larbda x:chr (ord (x.group (0)) “32), 'aaa aBc abde') 
# 英 文字 母 大 小 写 互 换 
RAPEC REDE' 
>>> re.subn (av "dfg' 'aaa abc abde') # 返 回 新 字符 串 和 替换 次 数 
("dfgdfgdfg dfgbc dfgbde',5) 
>>> re.sub('a', 'dfg', 'aaa abc abde') 
"dfgdfgdfg dfgbc dfgpde' 
>>> re.escape ('http://www.python.org') # 字 符 串 转 义 
"htbP\N\:\\ 人 NMwwN\.PYthonN\\.org'" 
>>> print (re.match ('done| quit', 'done')) # 匹 配 成 功 , 返 回 match 对 象 
< _sre.SRE Match cbject at 0x00B121A8> 
>>> print (re.match ('done| quit', 'done!')) # 匹 配 成 功 
< _sre.SRE Match cbject at 0x00B121R8> 
>>> print (re.match ('done| quit', 'doe!')) # 匹 配 不 成 功 ,返回 空 值 None 
None 
>>> Print (re.match ('done| quit', 'd!lone!')) # 匹 配 不 成 功 
None 
>>> print (re.search('done| quit', 'd!one!done')) # 匹 配 成 功 


< _sre.SRE Match cbject at 0x0000000002D03D98> 


下 面 的 代码 使 用 不 同 的 方法 删除 字符 串 中 多 余 的 空格 ,如 果 遇 到 连续 多 个 空格 则 只 
保留 一 个 ,同时 删除 字符 串 两 侧 的 所 有 空白 字符 。 


>>> jmport re 
>>> = 'aaa Jp cde fff a, 


>>> ' '.join(s.split()) # 直 接 使 用 字符 串 对 象 的 方法 
"aaa bb cde fff' 


>>> ' '.join(re.split("[\s]+ ',s.strip())) # 同 时 使 用 re 模块 中 的 函数 和 字符 串 对 象 的 方法 
‘aaa Hb cde fff' 

>>> ' '.join(re.split ('\st ',s.strip())) # 与 上 一 行 代码 等 价 

'aaa bb cde fff' 


>>> re.aub('\st ',' ',s.strip()) # 直 接 使 用 到 模块 的 字符 串 替 换 方法 


‘aga Hb cde fff' 
下 面 的 代码 使 用 几 种 不 同 的 方法 来 删除 字符 串 中 指定 的 内 容 : 


>>> erail= "tony@ tiremove thisger.net" 
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>>>m re.seardh ("remove this",email) 
>>> email [:m.start ()] +email fm.end() :] 
‘tony@ tiger.net' 

>>> re.sub('remove this','',email) 
‘tony@ tiger.net' 

>>> email.replace ('remove this','') 
"tony@ tiger.net' 


# 使 用 search() 方 法 返回 的 match 对 象 
# 字 符 串 切片 


# 直 接 使 用 re 模块 的 sub() 方 法 


# 直 接 使 用 字符 串 蔡 换 方法 


下 面 的 代码 使 用 以 \ 开 头 的 元 字符 来 实现 字符 串 的 特定 搜索 。 


>>> import re 


>>> example= 'Beautiful is better than ugly." 


>>> re.findall ('\\bb.+ ?2\\b',exanple) 


'better'] 

>>> re.findall ('\\bb.+ \\b',exarple) 
"better than ugly"] 

>>> re.findall ('\\bb\w* \\b'vexample) 
"better'] 

>>> re.findall ('\\Bh.+ ?2\\b',exanple) 
‘han'] 

>>> re.findall ('\\b\w.+ 2\\b',exanple) 
"Beautiful' "is', "better' 'than', "ugly'] 
>>> re.findall ('\wt ',exanple) 
"Beautiful' "is', "better' 'than', "ugly'] 
>>> re.findall (r'\b\w.+ ?\b',exanple) 
"Beautiful' 'is', "better' 'than', rugly'"] 
>>> re.split ('\s',exanple) 
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"Beautiful 'is', ‘better', 'than', "ugly.. '] 
>>> re.findall (\dt \.\dt \.\dt ', 'Python 2.7.137) 


# 以 字母 b 开 头 的 完整 单词 
# 此 处 问号 ?表示 非 贪心 模式 


# 贪心 模式 的 匹配 结果 


# 不 以 h 开 头 且 含有 h 字 母 的 单词 剩余 部 分 


# 所 有 单词 


# 所 有 单词 


# 使 用 原始 字符 串 


# 使 用 任何 空白 字符 分 隔 字 符 串 


# 查 找 并 返回 x.x.x 形 式 的 数字 


>>> re.findall (\dt \.\d+ \.\dt ', "Python 2.7.13,Python 3.6.0') 


[2.7.13","36,0"] 


>>> = '< html> < head> This is head.< /head> < body> This is body.< /body> < /hbnl> " 
>>> patterm=r'< html> < head> (.+ )< /head> < body> (.+ )< /body> < /html>" 


>>> result= re.search (pattem, s) 
>>> result.group (1) 

"This is head." 

>>> result.group (2) 

mmhis is body." 


# 第 一 个 子 模式 


# 第 二 个 子 模式 


8.3 ”使 用 正则 表达 式 对 象 处 理 字符 串 


虽然 直接 使 用 re 模块 也 可 以 使 用 正则 表达 式 处 理 字符 串 ,但 是 正则 表达 式 对 象 提供 
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了 更 多 的 功能 。 使 用 编译 后 的 正则 表达 式 对 象 不 仅 可 以 提高 字符 串 的 处 理 速度 ,还 提供 
了 更 加 强大 的 字符 串 处 理 功能 。 首 先 使 用 re 模块 的 compile() 方 法 将 正则 表达 式 编译 成 
正则 表达 式 对 象 , 然 后 使 用 正则 表达 式 对 象 提供 的 方法 进行 字符 串 处 理 。 


1. match() ,search() findall() 


正则 表达 式 对 象 的 match(string[，pos[， endpos]]) 方 法 在 字符 串 开 头 或 指定 位 置 
进行 搜索 ,模式 必须 出 现在 字符 串 开 头 或 指定 位 置 ; search(string[，pos[，endpos]]) 方 
法 在 整个 字符 串 或 指定 范围 中 进行 搜索 ;findall(string[，pos[，endpos]]) 方 法 字符 串 中 
查找 所 有 符合 正则 表达 式 的 字符 串 并 以 列表 形式 返回 。 


>>> import re 

>>> example= 'ShanDong Institute of Business and Technology' 

>>> patterm= re.ompile(r'\HB\wt \b') # 查 找 以 B 开 头 的 单词 

>>> Pattern.findall (exarple) # 使 用 正则 表达 式 对 象 的 fincall (方法 
["'Business'] 

>>> patterm= re.ompile(r'\wt g\b') # 查 找 以 字母 g 结 尾 的 单词 

>>> pattem.findall (example) 

["ShanDong'] 

>>> pattern re.ompile(r'\b[a- za- 2] {3}\b') # 查 找 3 个 字母 长 的 单词 

>>> pattem.findall (exanple) 

["and'] 

>>> Pattern match (example) # 从 字符 串 开头 开始 匹配 ,失败 返回 空 值 
>>> pattern.search (exanple) # 在 整个 字符 串 中 搜索 ,成 功 

< _sre.SRE Match cbject; sbanr (31,34) ,matchr 'and'> 

>>> Pattern re.compile(r'NbNwx a\wx \b') # 查 找 所 有 含有 字母 a 的 单词 

>>> pattern.findall (example) 

["ShanDong', "and'"] 

>>> text= "He was carefully disguised but captured quickly by Police." 

>>> re.findall (r"Nwr ly", text) # 查 找 所 有 以 字母 组 合 1y 结 尾 的 单词 


['carefully', 'quickly'] 
2. sub() subn() 


正则 表达 式 对 象 的 sub(repl, string[，count 二 0]) 和 subn(repl，string[，count 王 0]) 
方法 用 来 实现 字符 串 蔡 换 功 能 ,其 中 参数 repl 可 以 为 字符 串 或 返回 字符 串 的 可 调用 
对 象 。 

>>> exanple= '''Beautiful is better than ugly. 

Explicit is better than implicit. 

















Simple is better than omplex. 
Complex is better than omplicated. 
Flat is better than nested. 
Sparse is better than dense. 


四 
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. 
Readability counts.""" 
>>> patterm= re.cmpile(r'\Hb\w* \b',re.I) # 匹 配 以 b 或 B 开 头 的 单词 
>>> print (patterm.sub(' * ',exanple)) # 将 符合 条 件 的 单词 蔡 换 为 * 


* is# than ugly. 

Explicit isx than implicit. 

Simple isx than omplex. 

Complex isx than complicated. 

了 at is* than nested. 

Sparse is* than dense. 

Readability counts. 

>>> print (pattem.sub (lanbda x: x.group (0) .upper () ,exanple)) 
# 把 所 有 匹配 项 都 改 为 大 写 

BEAUTIFUL is BETTER than ugly. 

Eplicit is BETIER than implicit.。 

Sinple is BETIER than omplex. 

Complex is BETIER than complicated. 

Flat is BETIER than nested. 

Sparse is EETTER than dense. 

Readability counts. 

>>> print (pattern.sub(' * ',exanple,])) # 只 替换 一 次 

#* is better than ugly. 

Explicit is better than implicit. 

Simple is better than complex-。 

Complex is better than complicated.。 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 


>>> patterm= re.compile(r'NHbNwx \b') # 匹 配 以 字母 b 开 头 的 单词 
>>> print (pattem.sub(' * ',exanple,1)) # 将 符合 条 件 的 单词 替换 为 x 
# 只 替换 一 次 


Beautiful isx than ugly. 
Explicit is better than implicit. 
Simple is better than omplex. 
Complex is better than complicated. 
Flat is better than nested. 

Sparse is better than dense. 


3. split() 


正则 表达 式 对 象 的 split(string[ ,maxsplit 二 0]) 方 法 用 来 实现 字符 串 分 隔 。 


>>> example=r'cne, two, three.four/five\six?seven[eight]nine| ten' 
>>> patterm= re.ompile(r'[,.A\\?[]\1]') # 指 定 多 个 可 能 的 分 隔 符 
>>> Pattern.split (example) 





第 8 章 文本 处 理 ( 二 ): 正则 表达 式 色 183 
® 


[ronev "twov 'three', 'four", "five' 'six', 'seven', 'eight', nine', "ten'] 

>>> example=I'oneltwo2three3four4five5six6seven7eightSnine9ten'" 

>>> pattern= re.ompile(r'\d+ ') # 使 用 数字 作为 分 隔 符 
>>> pattern.split (example) 

['one', "twov 'three', 'four', 'five', 'six', 'seven', eight' nine', ‘ten'] 

>>> exanple=r'one two three four,five.six.seven,eight,nineten' 
>>>Ppattern re.ompile(r'[\s,.\d]+ ') # 人 允许 分 隔 符 重复 
>>> pattern.split (example) 

['one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', inev rten'] 


8.4 match 对 和 象 


正则 表达 式 模块 或 正则 表达 式 对 象 的 match() 方 法 和 search() 方 法 匹配 成 功 后 都 会 
返回 match 对 象 。match 对 象 的 主要 方法 有 group() (返回 匹配 的 一 个 或 多 个 子 模式 内 
容 ) .groups()( 返 回 一 个 包含 匹配 的 所 有 子 模 式 内 容 的 元 组 ) .groupdict()( 返 回 包含 匹配 
的 所 有 命名 子 模 式 内 容 的 字典 ) 、start() (返回 指定 子 模式 内 容 的 起 始 位 置 )、end() (返回 
指定 子 模式 内 容 的 结束 位 置 的 前 一 个 位 置 )、span() (返回 一 个 包含 指定 子 模式 内 容 起 始 
位 置 和 结束 位 置 前 一 个 位 置 的 元 组 ) 等 。 

下 面 的 代码 演示 了 match 对 象 的 group() groups() 与 groupdict() 以 及 其 他 方法 的 
用 法 : 


>>>m re.matah(r"(\wt ) (\wt )", "Isaac Newton,physicist") 


>>>m.group(0) # 返 回 整 个 模式 内 容 

"Isaac Newton' 

>>>m.group(1) # 返 回 第 一 个 子 模式 内 容 
"Tsaacy 

>>>m.group (2) # 返 回 第 二 个 子 模式 内 容 
‘Newton' 

>>>m.group(1,2) # 返 回 指定 的 多 个 子 模式 内 容 


(Tsaac' ‘Newton') 
下 面 的 代码 演示 了 子 模式 扩展 语法 的 用 法 : 


>>>m Te.match (r"(?Ec first name> \wt ) (?P< last name> \wt )","Malcolm Reynolds") 
>>>m.group ('first_name') # 使 用 命名 的 子 模式 

‘Maloolm' 

>>>m.group('last name') 

"Reynolds' 

>>>me re.match(r"(\dt )\.(\dt )","24.1632") 

>>>m.groups() # 返 回 所 有 匹配 的 子 模式 (不 包括 第 0 个 ) 
("24", "1632') 

>>>me re.matah(r" (?P< first name> \wt ) (2P< last name> \wt+ )","Malcolm Reynolds") 
>>>m.groupdict () # 以 字典 形式 返回 匹配 的 结果 
{'first_ name': elcolm "last_ name': ‘Reynolds'} 
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>>> exanpleString= '' "There should be one  - and preferably only one - - dovious way to do it. 
Although that way may not be dovious at first unless you're Dutch. 
Now is better than never. 
Although never is often better than right now.'"' 
>>> patterr= Te.compile(r' (2<=\W\s)never (>= \s\w) ') 
# 查 找 不 在 句子 开头 和 结尾 的 never 
>>> matdhResult= Pattern.search (exampleString) 
>>> matchResult .span() 
(172,177) 
>>> Pattern= re.compile(r' (2< = \w\s)never') 
# 查 找 位 于 句子 末尾 的 单词 
>>>matchResult= Pattern.search (exanpleString) 
>>> matchResult.span() 
(156,161) 
>>> Pattern= re.ompile(r' (2:is\s)better (\sthan) ') 
# 查 找 前 面 是 is 的 better than 组 合 
>>> matchResult= pattem.seardh (exampleString) 
>>> matchResult .span() 
(141,155) 
>>> matchResult.group (0) # 组 0 表示 整个 模式 
"is better than' 
>>> matchResult .group (]) 
人 
>>> pattern= re.compile(r'\b(?i)nNwt \b') 
# 查 找 以 n 或 N 字 母 开 头 的 所 有 单词 
>>> index=0 
>>> while True: 
matchResult= pattem.search (exanpleString, index) 
if not matchResult: 
break 
Print (matchResult .group (0), ':',matchResult.span(0)) 
index= matchResult .end (0) 
not : (92,95) 
Now : (137,140) 
never : (156,161) 
never : (172,177) 
now : (205,208) 
>>> pattem re.compile(r' (2< Inot\s)be\b') # 查 找 前 面 没有 单词 not 的 单词 pe 
>>> indes=0 
>>> while True: 
matchResult= pattem. search (exampleString index) 
if not matchResult: 
break 
Print (matchResult .group (0)，: ',matchResult.span(0)) 
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indes— mat chResult .end (0) 
be : (13,15) 
>>> examplestring[13:20] ## 验 证 一 下 结果 是 否 正确 
全 
>>> Pattern= re.ompile(r' (\b\w* (?P< 他 \wr ) (32P=f£)\w* \b) 

# 匹 配 有 连续 相同 字母 的 单词 

>>> index=0 
>>> while True: 

matchResult— pattem. search (examplestring index) 

if not matchResult: 

break 

Print (matchResult .group (0), ':',matdhResult .group (2)) 

index=matchResult.end(0) +1 
wnless :3 
better :七 
better :七 
>>> 上 = 'aabc abcd ahbcd abood abodd' 
>>>EF re.ompile(r'(\b\w* (2P< f> \wt) (2P=f£)\w* \b)') 
>>>p.findall (s) 
[ ("aabc', 'a'), (‘atbod', 'b'), (‘abcod', 'c'), (‘abodd', 'd')] 


8.5 精彩 案例 赏析 
示例 8-1 使 用 正则 表达 式 提取 字符 串 中 的 电话 号 码 。 
import re 


telNmber= '''Suppose my Fhone No. is 0535- 1234567, 
yours is 010- 12345678, 
his is 025- 87654321.'"" 


Fatterm= re.compile(r'(\df3,4)- (\d{7,8}) ') # 注 意 ,逗号 后 面 不 能 有 空格 
index=0 
while True: 
matchResult= pattern.search (telNuniber, index) # 从 指定 位 置 开 始 匹配 
if not matchResult: 
break 


print ('— '* 30) 
print ('Sucoess:') 
for i in range (3): 
print ('Searched ontent:',matdhResult.group(i),\ 
+ Start fram: vmatchResult.start (i), "End at:',matchResult.end (i),\ 
' Its span is:',matchResult.span (i)) 
index— mat chiResult.end (2) # 指 定 下 次 匹配 的 开始 位 置 
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示例 8-2 使 用 正则 表达 式 批量 检查 网 页 文件 是 否 包含 iframe 框架 。 


import os 
import re 


Gef detectIframe (fp) : 
# 存 放 网 页 文件 内 容 的 列表 
content= [] 
with open (fn,enooding= "utf- 8') as fp: 
# 读 取 文件 的 所 有 行 ,删除 两 侧 的 空白 字符 ,然后 添加 到 列表 中 
for line in 印 : 
content .append (line.strip()) 
# 把 所 有 内 容 连 接 成 字符 串 
content= ' ' .join (content) 
# 正 则 表达 式 
IE re.findall (r'< iframe\s+ src= .# ?>< /iframe> ',omtent) 
ifm: 
# 返 回 文件 名 和 被 嵌入 的 框架 
retum {fn:m} 
retum False 


for fn in (f for fin os.listdir('.') if f.endswith((' .html",'.htm’))): 

= detectIframe (fn) 
if not r: 

continue 
# 输 出 检查 结果 
for k,v in r.items(): 

Print (k) 

for vv inv: 

Print ("\t',vw) 


本 章 小 结 


(1) 正则 表达 式 使 用 预定 义 的 模式 去 匹配 一 类 具有 共同 特征 的 字符 串 , 可 以 快速 、 准 
确 地 完成 复杂 的 查找 、 替 换 等 处 理 要 求 , 比 字符 串 自 身 提 供 的 方法 提供 了 更 加 强大 的 处 理 
功能 。 

(2) 正则 表达 式 使 用 圆 括号 表示 一 个 子 模式 , 圆 括号 里 的 内 容 作 为 一 个 整体 对 待 。 

(3) 正则 表达 式 只 是 在 形式 上 进行 检查 ,并 不 保证 内 容 一 定 正确 。 

(4) 正则 表达 式 模块 或 正则 表达 式 对 象 的 match() 方 法 和 search() 方 法 匹配 成 功 后 
都 会 返回 match 对 象 。 


习 题 


8.1 有 一 段 英 文 文本 ,其 中 有 个 单词 连续 重复 了 2 次 ,编写 程序 检查 重复 的 单词 并 
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只 保留 一 个 。 例 如 ,文本 内 容 为 “This is is a desk. ”, 程 序 输出 为 “This is a desk. ”。 
8.2 编写 程序 ,用 户 输入 一 段 英 文 , 然 后 输出 这 段 英 文中 所 有 长 度 为 3 个 字母 的 
单词 。 
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文件 是 长 久保 存 信息 并 允许 重复 使 用 和 反复 修改 的 重要 方式 ,同时 也 是 信息 交换 的 重要 
途径 。 记 事 本 文件 .日 志文 件 、 各 种 配置 文件 .数据库 文件 .图像 文件 .音频 和 视频 文件 .可 执行 
文件 .Office 文件 ,动态 链接 库 文件 等 ,都 以 不 同 的 文件 形式 存储 在 各 种 存储 设备 (如 磁盘 `U 盘 、 
光盘 ` 云 盘 、 网 盘 等 ) 上 。 按 数据 的 组 织 形 式 ,可 以 把 文件 分 为 文本 文件 和 二 进 制 文件 两 大 类 。 


1. 文本 文件 


文本 文件 存储 的 是 常规 字符 串 ,由 若干 文本 行 组 成 ,通常 每 行 以 换行 符 \n' 结 尾 。 常 
规 字符 串 是 指 记事 本 之 类 的 文本 编辑 器 能 正常 显示 编辑 并 且 人 类 能 够 直接 阅读 和 理解 
的 字符 串 , 如 英文 字母 .汉字 数字 字符 串 。 在 Windows 平台 中 ,扩展 名 为 txt\log ,ini 的 
文件 都 属于 文本 文件 ,可 以 使 用 字 处 理 软件 如 gedit ,记事 本 、UltraEdit 等 进行 编辑 。 实 
际 上 文本 文件 在 磁盘 上 也 是 以 二 进 制 形式 存储 的 ,只 是 在 读 取 和 查看 时 使 用 正确 的 编码 
方式 进行 解码 还 原 为 字符 串 信 息 了 ,所 以 可 以 直接 阅读 和 理解 。 


2. 二 进 制 文件 


常见 的 如 图 形 图 像 文 件 . 音 视频 文件 .可 执行 文件 ,资源 文件 .各 种 数据 库 文件 .各 类 
Office 文件 等 都 属于 二 进 制 文件 。 二 进 制 文件 把 信息 以 字 节 串 (bytes) 进 行 存 储 , 无 法 用 
记事 本 或 其 他 普通 字 处 理 软件 直接 进行 编辑 ,通常 也 无 法 直接 阅读 和 理解 ,需要 使 用 正确 
的 软件 进行 解码 或 反 序列 化 之 后 才能 正确 地 读 取 、 显 示 、 修 改 或 执行 。 图 9-1 中 使 用 
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图 9-1 二 进 制 文件 无 法 使 用 文本 编辑 器 直接 查看 
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Windows 记事 本 打开 Python 主 程序 文件 python. exe, 该 文件 是 二 进 制 可 执行 文件 ,无 法 
使 用 记事 本 查看 ,显示 乱码 。 也 可 以 使 用 HexEditor、010Editor 等 十 六 进 制 编辑 器 打开 
二 进 制 文件 进行 查看 和 修改 ,但 需要 对 不 同类 型 的 二 进 制 文件 结构 有 非常 深入 的 理解 ,如 
图 9-2 所 示 。 
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Python.exe 

Fle Edi offser |0 1 2 3 4 5 5 7 89ABCDErF ~ 
00000000 | 4D 5A 90 00 03 00 00 00 04 00 00 00 FF FF 00 00|MZ 区 国 rp 
00000010 ,Be 00 00 00 00 00 00 00 40 00 00 00 00 00 00 00 , © C\python 3.5 
00000020 ,oo 00 00 00 00 00 00 00 o0 00 00 00 00 00 00 00 
Doonno30 oo on on oo on o0 o0 on0 oo oo oo0 on 00 01 00 00 File Size: 40.3 KB 
oo000040 |0E IF BA OE 00 B4 09 cD 21 66 ol 4c CD 21 54 66 s :il LilTh 20 by 
00000050 |69 73 20 70 72 6F 67 72 61 6D 20 63 61 6F 6E 6F | is program canno DefauktEdit Mode 
00000060 |74 20 62 65 20 72 75 6E 20 69 6E 20 44 4F 53 20 t+ be run in DOS Statc originel 
D0000070 | ED EF 64 65 2E OD OD OA 24 00 00 00 00 00 00 00 Wa 0 
00000080 ,4E SA 2B 3F OA 38 45 6C OA 3B 45 6C OA 3B 45 6C :EL 下 
00000090 |03 43 D6 6C 00 3B 45 6C EF 62 44 6D 08 3B 45 5C ;EL 
000000A0 |EF 62 46 6D 08 36 45 6C EF 62 40 6D 1A 3B 45 5C ;EL Creation ime: 2015-12-06 
00000080 (EF 62 41 6D 01 38 45 6C F8 62 44 6D 09 38 45 6C 5E1 ee 
000000c0 |D7 C4 BE 6C 08 3B 45 6C OA 3B 44 6C 3B 3B 45 6C 了 Last write imet 。 2015-12-05 
000000D0 |F6 62 4D 60 08 36 45 6C F6 62 BA 6C OB 38 45 5C DL55:40 
ONnNNONEN |FB 62 47 6D 08 3B 45 6C S52 69 63 68 OA 3B 45 6C EF Attributec: A 
O00000F0 |00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 Jcons 1 
00000100 |50 45 00 00 64 86 06 00 98 95 63 55 00 00 00 00 PE dl licv i i 
onoonll0 mo oo oo 00 Fo 00 22 00 OB 02 OF 00 00 14 00 oO0 SE i ee 
ooo00120 J00 76 00 00 00 00 00 oo 1c 13000000100000 vy Ol Fe 
00000130 |00 00 00 1D 00 00 00 00 00 10 00 00 00 02 00 00 Byies per page: «35x16=560 
‘00000140 |06 00 00 00 00 00 00 00 06 00 00 00 00 00 00 00 Wi 四 1 
00000150 |00 DO 00 00 00 04 00 00 06 18 01 00 03 00 60 81 5 “ IN 1 
00000160 |80 64 1E 00 00 00 00 00 00 10 00 00 00 00 00 00 1 
00000170 |00 00 10 00 00 00 00 00 00 10 00 00 00 00 00 00 Clipboard: available 
00000180 |o0 oo 00 00 10 00 00 00 oo 00 00 00 00 00 00 00 TEMP folder 167GBfree | 





图 9-2 使 用 WinHex 十 六 进 制 编辑 器 打开 可 执行 文件 


9.1 文件 操作 基本 知识 


无 论 是 文本 文件 还 是 二 进 制 文件 ,操作 流程 基本 都 是 一 致 的 ,首先 打开 文件 并 创建 文 
件 对 象 , 然 后 通过 该 文件 对 象 对 文件 内 容 进行 读 取 、 写 入 、 删 除 \ 修 改 等 操作 ,最 后 关闭 并 
保存 文件 内 容 。 


911 内 置 函数 open0 


Python 内 置 函 数 open() 可 以 用 指定 模式 打开 指定 文件 并 创建 文件 对 象 ,该 函数 完 
整 的 用 法 如 下 ,由 于 很 多 参数 都 有 默认 值 ,在 使 用 时 只 需 给 特定 的 参数 传 值 即 可 。 


cpen (file,mode= "Ir"',buffering= - 1, encoding= None, errors= None, newline= None, closefd= True, opener= 
None) 


内 置 函 数 open() 的 主要 参数 含义 如 下 。 

(1) 参数 file 指定 要 打开 或 创建 的 文件 名 称 ,如 果 该 文件 不 在 当前 目录 中 ,可 以 使 月 
相对 路 径 或 绝对 路 径 ,为 了 减少 路 径 中 分 隔 符 的 输入 ,可 以 使 用 原始 字符 串 。 

(2) 参数 mode( 取 值 范围 见 表 9-1) 指 定 打开 文件 后 的 处 理 方式 。 例 如 性 只 读 尖 只 
写 ”“ 读 写 “ 和 追加” 二进制 只 读 ”“ 二 进 制 读 写 ” 等 ,默认 为 “文本 只 读 模式 ”。 以 不 同方 式 打 
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开 文件 时 ,文件 指针 的 初始 位 置 略 有 不 同 。 以 “只 读 ” 和 “只 写 ” 模 式 打 开 时 文件 指针 的 初 
始 位 置 是 文件 头 ,以 “追加 ”模式 打开 时 文件 指针 的 初始 位 置 为 文件 尾 。 以 “只 读 ” 方 式 打 
开 的 文件 无 法 进行 任何 写 操作 ,反之 亦 然 。 
表 9-1 文件 打开 模式 
模式 说 明 
r “| 读 模式 (默认 模式 ,可 省 略 ) ,如 果 文 件 不 存在 则 抛 出 异常 
w | 写 模式 ,如 果 文 件 已 存在 , 先 清空 原 有 内 容 
x | 写 模 式 , 创 建新 文件 ,如 果 文 件 已 存在 则 抛 出 异常 
a | 追加 模式 ,不 覆盖 文件 中 原 有 内 容 
b | 二 进 制 模式 (可 与 其 他 模式 组 合 使 用 ) ,使 用 二 进 制 模式 打开 文件 时 不 允许 指定 encoding 参数 
t | 文本 模式 (默认 模式 ,可 省 略 ) 
十 | 读 、 写 模式 (可 与 其 他 模式 组 合 使 用 ) 





























如 果 执 行 正 常 ,open() 函 数 返回 一 个 可 迭代 的 文件 对 象 ,通过 该 文件 对 象 可 以 对 文 
件 进行 读 写 操作 ,如 果 指 定 文件 不 存在 、 访 问 权限 不 够 磁盘 空间 不 够 或 其 他 原因 导致 创 
建文 件 对 象 失败 则 抛 出 异常 。 下 面 的 代码 分 别 以 读 、 写 方式 打开 了 两 个 文件 并 创建 了 与 
之 对 应 的 文件 对 象 。 

fl= open('filel.txt', 'r') 

£2= open('file2.txt', 'w') 

当 对 文件 内 容 操 作 完 以 后 ,一定 要 关闭 文件 对 象 ,这 样 才 能 保证 所 做 的 任何 修改 都 被 
保存 到 文件 中 。 

也 .close() 

需要 注意 的 是 ,即使 写 了 关闭 文件 的 代码 ,也 无 法 保证 文件 一 定 能 够 正常 关闭 。 例 如 ， 
如 果 在 打开 文件 之 后 和 关闭 文件 之 前 发 生 了 错误 导致 程序 崩溃 ,这 时 文件 就 无 法 正常 关闭 。 
在 管理 文件 对 象 时 推荐 使 用 9. 1. 3 节 介绍 的 with 关键 字 , 可 以 有 效 地 避免 这 个 问题 。 


912 文件 对 象 属性 与 常用 方法 


如 果 执 行 正常 ,open() 函数 返回 一 个 可 迭代 的 文件 对 象 ,通过 该 文件 对 象 可 以 对 文 
件 进行 读 写 操作 。 文 件 对 象 常用 属性 如 表 9-2 所 示 。 


表 9-2 文件 对 象 常用 属性 














属 性 说 明 

buffer 返回 当前 文件 的 缓冲 区 对 象 

closed 判断 文件 是 否 关闭 , 若 文件 已 关闭 则 返回 True 
fileno 文件 号 ,一 般 不 需要 太 关 心 这 个 数字 
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续 表 





属 性 


说 有明 





mode 


返回 文件 的 打开 模式 





name 





返回 文件 的 名 称 





文件 对 象 常用 方法 如 表 9-3 所 示 。 需 要 特别 说 明 的 是 ,文件 读 写 操作 相关 的 函数 都 
会 自动 改变 文件 指针 的 位 置 。 例 如 ,以 读 模式 打开 一 个 文本 文件 , 读 取 10 个 字符 ,会 自动 
把 文件 指针 移动 到 第 11 个 字符 的 位 置 ,再 次 读 取 字 符 的 时 候 总 是 从 文件 指针 的 当前 位 置 
开始 , 写 入 文件 的 操作 函数 也 具有 相同 的 特点 。 


方 法 


表 9-3 文件 对 象 常用 方法 
功能 说 明 





close() 


把 缓冲 区 的 内 容 写 和 文件 ,同时 关闭 文件 ,并 释放 文件 对 象 





flush() 


把 缓冲 区 的 内 容 写 和 文件 ,但 不 关闭 文件 





read([size]) 


从 文本 文件 中 读 取 size 个 字 节 (Python 2. x) 或 字符 (Python 3. x) 的 内 容 作 
为 结果 返回 ,或 从 二 进 制 文件 中 读 取 指定 数量 的 字 节 并 返回 ,如 果 省 略 size 
则 表示 读 取 所 有 内 容 





readline() 


从 文本 文件 中 读 取 一 行内 容 作为 结果 返回 





readlines() 


把 文本 文件 中 的 每 行文 本 作为 一 个 字符 串 存 人 列表 中 ,返回 该 列表 ,对 于 大 
文件 会 占用 较 多 内 存 , 不 建议 使 用 





seek(offset[ ，whence]) 


把 文件 指针 移动 到 新 的 位 置 ,offset 表示 相对 于 whence 的 位 置 。whence 为 
0 表示 从 文件 头 开 始 计算 , whence 为 1 表示 从 当前 位 置 开 始 计算 , whence 
为 2 表示 从 文件 尾 开 始 计算 ,默认 为 0 





seekable() 


测试 当前 文件 是 否 支 持 随机 访问 ,如 果 文件 不 支持 随机 访问 , 则 调用 方法 
seek() ,tell() 和 truncate() 时 会 抛 出 异常 





tell() 


返回 文件 指针 的 当前 位 置 





write(s) 


把 字符 串 s 的 内 容 写 入 文件 





writelines(s) 





把 字符 串 列 表 写 人 文本 文件 ,不 添加 换行 符 


913 上 下 文 管理 语句 with 


在 实际 开发 中 , 读 写 文件 应 优先 考虑 使 用 上 下 文 管理 语句 with ,关键 字 with 可 以 自 
动 管理 资源 ,不 论 因为 什么 原因 (哪怕 是 代码 引发 了 异常 ) 跳 出 with 块 ,总 能 保证 文件 被 
正确 关闭 ,可 以 在 代码 块 执行 完毕 后 自动 还 原 进入 该 代码 块 时 的 上 下 文 ,常用 于 文件 操 
作 , 数 据 库 连 接 、 网 络 通信 和 连接、 多 线程 与 多 进程 同步 时 的 锁 对 象 管理 等 场合 。 用 于 文件 
内 容 读 写 时 ,with 语句 的 用 法 如 下 : 


with open (filename, mode, encoding) as 印 : 
# 这 里 通过 文件 对 象 名 读 写 文件 内 容 的 语句 
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另外 ,上 下 文 管理 语句 with 还 支持 下 面 的 用 法 ,进一步 简化 了 代码 的 编写 。 


with open('test.txt', 'r') as src, open('test new.txt', ‘w') as dst: 
dst.write (src.read()) 


9.2 文本 文件 内 容 操作 案例 精 选 


在 本 章 开始 曾经 提 到 ,文本 文件 在 磁盘 上 也 是 以 二 进 制 字 节 串 的 形式 存储 的 ,在 操作 
文本 文件 内 容 时 ,一 定 要 注意 字符 串 的 编码 格式 ,否则 可 能 会 影响 内 容 的 正确 识别 和 
处 理 。 

示例 9-1 将 字符 串 写 人 文本 文件 ,然后 再 读 取 并 输出 。 


s 'Hello world\n 文 本 文件 的 读 取 方 法 \n 文 本 文件 的 写 入 方法 \n' 


with open('sanple.txt', 'w') as fp: # 默 认 使 用 ce936 编 码 
fp.write(s) 
with open('sanple.txt') as fp: # 默 认 使 用 ce936 编 码 
Print (fp.read()) 
示例 9-2 将 一 个 CP936 编码 格式 的 文本 文件 中 的 内 容 全 部 复制 到 另 一 个 使 用 
UTF-8 编码 的 文本 文件 中 。 


def fileCcpy (src, dst, srcEnooding, dstEnooding) : 
with cpen (src, 'r',encoding= srcEncoding) as srcfp: 
with open (dst, 'w',encoding= dstEncoding) as dstfp: 
dstfp.write (srcfp.read()) 


和 lecopy('sample.bxtt' 'sarple_new.txt', 'qp936', rutE- 8') 
示例 9-3 遍历 并 输出 文本 文件 的 所 有 行内 容 。 


with open('sanrple.txt') as fp: # 假 设 文件 采用 ce936 编 码 
for line in 印 : # 文 件 对 象 可 以 直接 迭代 
Print (line) 


示例 9-4 假设 已 有 一 个 文本 文件 sample. txt, 将 其 中 第 13、14 两 个 字符 修改 为 测试 。 


with open('sanple.txt', 'rt ') as fp: 
外 .seek(13) 
名 -write(' 测 试 ') 
示例 9-5 假设 文件 data. txt 中 有 若干 整数 ,所 有 整数 之 间 使 用 英文 逗号 分 隔 ,编写 
程序 读 取 所 有 整数 ,将 其 按 升 序 排序 后 再 写 入 文本 文件 data_asc. txt 中 。 
with open('data.txt', 'r') as fp: 
data— fp.readlines () # 读 取 所 有 行 
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data= [line.strip() for line in data] # 删 除 每 行 两 侧 的 空白 字符 
data= ', ' .join (data) # 合 并 所 有 行 
data= data.split (', ') # 分 隔 得 到 所 有 数字 字符 串 
data= [int (item) for iten in data] # 转 换 为 数字 
data.sort () # 升 序 排序 
aata= ', ' .join (nap (str,data)) # 将 结果 转换 为 字符 串 
with apen('data asc.txt', Ww') as 印 : # 将 结果 写 入 文件 

fp.write (data) 


示例 9-6 统计 文本 文件 中 最 长 行 的 长 度 和 该 行 的 内 容 。 


with copen('sanple.txt') as 印 : 
result= [0,''] 
for line in fp: 
t= len(line) 
if t> result [0]: 
result= [t, line] 
Print (result) 


示例 9-7 使 用 标准 库 json 进行 数据 交换 。 

JSON(JavaScript Object Notation) 是 一 种 轻 量 级 的 数据 交换 格式 ,易于 阅读 和 编写 ， 
同时 也 易于 机 器 解析 和 生成 (一 般 用 于 提升 网 络 传 输 速率 ) ,是 一 种 比较 理想 的 编码 与 解 
码 格式 。Python 标准 库 json 提供 对 JSON 的 支持 。 


>>> import json 
>>>= [1,2,3] 
>>> json.durps (x) # 对 列表 进行 编码 
"[1,2,3]" 
>>> json.loads( ) # 解 码 
[1,2,3] 
Eo mk 2 3 # 对 字典 进行 编码 
>>> 于 jason.dmpe (x) 
>>> type (y) 
<class 'str'> 
>>> json.loads (y) 
te 
>>> with cpen ('test.txt', 'w') as fp: 
json.dump ({'a':l, b':2, 'c':3},fh) # 写 和 人 文件 


>>> with cpen ('test.txt' 'r') as fp: 
print 0jscn.lcad(fp)) # 从 文件 中 读 取 
ta DDS 


示例 9-8 ”使 用 csv 模块 读 写 文件 内 容 。 
CSV(Comma Separated Values) 格 式 的 文件 常用 于 电子 表格 和 数据 库 中 内 容 的 导入 
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和 导出 。Python 标准 库 csv 提供 的 reader、writer 对 象 和 DictReader、DictWriter 类 很 好 
地 支持 了 CSV 格式 文件 的 读 写 操作 。 另 外 ,csvkit 支持 命令 行 方式 来 实现 更 多 关于 CSV 
文件 的 操作 以 及 与 其 他 文件 格式 的 转换 。 感 兴趣 的 可 以 参考 下 面 的 网 址 : 


https://source.copennews.org/en- US/articles/eleven- awesame things- you- can- do- csvkit/。 
>>> import csv 
>>> with open('test.csv', Ww',newline= '') as 印 : 
test writer= csv.writer (fp,delimiter= ' ',quotechar= '") # 创 建 writer 对 象 
test writer.writerow(['red', "blue', 'green']) # 写 入 一 行内 容 
test writer.writerow(['test string']* 5) 
>>> with open('test.csv',newline= '') as 印 : 
test_reader= csv.reader (fp,delimiter= ， ',quptedhar= '"") 。” # 创 建 reader 对 象 
for row in test reader: # 遍 历 所 有 行 
print (row) # 每 行 作为 一 个 列表 返回 
['red', "blue', 'green'] 
['test_ string', 'test_ string', 'test string', 'test string', 'test string'] 
>>> With copen('test.csv',newline= '') as fp: 
test_reader= cav.reader (fp,delimiter= ':',quotechar= '") # 使 用 不 同 的 分 隔 符 
for row in test reader: 
print (row) # 注 意 ,与 上 面 的 输出 不 同 
['red blue green'] 
['test string test string test string test string test string'] 
>>> with open('test.csv',newline= '') as fp: 
test reader= csv.reader (fp,delimiter= ' ',quotechar= '™) 
for row in test reader: 
print (','.join(row)) # 重 新 组 织 数 据 形式 
red,blue, green 
test_string,test string,test string,test string,test string 
>>> with cpen ('names.csv', 'w') as fp: 


headers= [" 姓 氏 "名 字 ?] 


test_dictWriter= csv.DictWriter (fp, fieldnames= headers) # 创 建 ictwriter 对 象 
test_dictWriter.writeheader() # 写 人 表 头 信息 
test dictWiriter.writerow({" 姓 氏 ':" 张 ,名 字 ':' 三 中 # 写 人 数据 


test_dictWriter.writerow({' 姓 氏 ':' 李 ',' 名 字 ':' 四 中 ) 
test_dictWriter.writerow({' 姓 氏 ':' 王 ',' 名 字 ':' 五 '}) 
>>> with cpen ('names.cav') as fp: 


test dictReader= csv.DictReader (fp) # 创建 ictReader 对 象 
Print (', '.join (test dictReader.fieldnames)) # 读 取 表 头 信息 
for row in test dictReader: # 遍 历 文件 所 有 行 
print trow[" 姓 氏 wzow[" 名 字 7) 
姓氏 ,名 字 
类 
李 , 四 


2 
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示例 9-9 编写 程序 ,统计 指定 目录 所 有 C++ 源 程 序 文件 中 不 重复 代码 的 行 数 。 
本 例 只 考虑 C++ 源 程序 文件 (扩展 名 为 cpp) ,并 且 只 认为 严格 相等 的 两 行为 重复 行 。 


fram os.path import isdir, join 
fram os import listdir 


NotRepeatedLines= [] # 保存 非 重复 的 代 
码 行 

file ne=0 # 文 件数 量 

code nun 0 # 代 码 总 行 数 


Gef LinesCount (directory) : 
global NotRepeatedLines, file nm,code num 
for filename in listdir (directory): 


tenp= join (directory, filename) 
if isdir(temp) : # 递 归 遍 有 历 子 文件 夹 
IinesCount (temp) 
elif temp.endswith(' .aqpp'): # 只 考虑 .qp 文 件 
file mm+=1 
with cpen (temp, 'r') as 印 : 
for line in fp: 
line= line. strip() # 删 除 两 端的 空白 
字符 
if line not in NotRepeatedLines: 
NotRepeatedLines.append (line) # 记 录 非 重复 行 
code mm+=1 # 记 录 所 有 代码 行 


Path= r'C:\Users\Dong\Desktop\VC++ 6.0" 
print ("总 行 数 : {0}, 非 重复 行 数 : {1}'.fommat (code_nmum, len (NotRepeatedLines))) 
print ("文件 数量 : {0}'.fommat (file num) 


示例 9-10 修改 HTML 网 页 文件 ,使 用 iframe 框架 嵌入 另 一 个 HTML 页 面 。 
def infectHtml (fileName, infectedContent): 


with cpen (fileName, "at ') as fp: 
外 .write (infectedcontent) 


content= '< iframe src= "anctherfioml.html" height= 50px width= 200p>< /iframe> ' 
infectHtml ('"index.htrml' content) 
示例 9-11 修改 HTML 网 页 文件 ,插入 网 页 打开 时 能 够 自动 运行 的 JavaScript 
脚本 。 
def infectHtml (fileName, infectedContent): 
with cpen (fileName, 'r') as fp: 
lines= fp.readlines () 
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for index, line in enmerate (lines) : 
if line.strip() .lower() .startswith('<hbml> '): 
lines.insert (indext 1l,infectedcontent) 
break 
with open (fileName, 'w') as fp: 
fp.writelines (lines) 


content= '< head> < script> windbw.anlcadF functicn() {alert ("test");]}< /script> < /head>"' 
infectHtml ("index.html' ,content) 


9.3 二进制 文件 操作 案例 精 选 


数据 库 文件 、 图 像 文 件 、 可 执行 文件 、 动 态 链 接 库 文件 .音频 文件 ,视频 文件 ,Office 文 
件 等 均 属 于 二 进 制 文件 。 对 于 二 进 制 文件 ,不 能 使 用 记事 本 或 其 他 文本 编辑 软件 直接 进 
行 正常 读 写 ,也 不 能 通过 Python 的 文件 对 象 直接 读 取 和 理解 二 进 制 文件 的 内 容 。 必 须 
正确 理解 二 进 制 文件 结构 和 序列 化 规则 ,然后 设计 正确 的 反 序列 化 规则 ,才能 准确 地 理解 
二 进 制 文件 内 容 。 

所 谓 序列 化 ,简单 地 说 就 是 把 内 存 中 的 数据 在 不 丢失 其 类 型 信息 的 情况 下 转 成 二 进 
制 形式 的 过 程 ,对 象 序列 化 后 的 数据 经 过 正确 的 反 序 列 化 过 程 应 该 能 够 准确 无 误 地 恢复 
为 原来 的 对 象 。Python 中 常用 的 序列 化 模块 有 struct、pickle、shelve 和 marshal。 


931 使 用 picde 模 块 读 写 二 进 制 文件 


标准 库 pickle 提供 的 dumpQ 〇 方法 (protocol 参数 为 True 时 可 以 实现 压缩 的 效果 ) 将 
数据 进行 序列 化 并 写 入 文件 ,load() 方 法 读 取 二 进 制 文件 内 容 并 进行 反 序列 化 ,还 原 为 原 
示例 9-12 使 用 pickle 模块 读 写 二 进 制 文件 。 


import pickle 


应 13000000 

a 99.056 

s= "中 国人 民 123abc" 

lst= [[1,2,3], [4,5,6], [7,8,9]] 

tur (~ 5,10,8) 

coll= {4,5,6} 

dic- {'a':'apple', 'b': ‘banana', 'g': 'grape', '0': 'orange'} 
aatar (i,a,s,1st,tu,coll,dic) 


with open ('sample picke.dat', Wb') as f: 
try: 
pickle.dunp (len (data) ,f) # 要 序列 化 的 对 象 个 数 
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for item in data: 
pickle.dnp (item, f) # 序 列 化 数据 并 写 入 文件 
except: 
print (' 写 文件 异常 ') 


with open('sanple pickle.dat', 'rb') as f: 


m=pickle.load(f) # 读 出 文件 中 的 数据 个 数 
for i in range (n): 
=pickle.load(f) # 读 取 并 反 序列 化 每 个 数据 
print (x) 


示例 9-13 ”把 文本 文件 test. txt 中 的 所 有 信息 使 用 pickle 进行 序列 化 并 写 和 二进制 
文件 test_pickle. dat。 


import pickle 


with open('test.txt') as src,open('test pickle.dat', 'wb') as dest: 
for line in src: 


pickle.durp (line, dest) 


with open('test_ pickle.dat', '1b') as fp: 
while True: 
try: 
Print (pickle. load (fp)) 
except: 
break 


pickle 模块 还 提供 了 一 个 dumps() 和 loads() 函 数 , 前 者 可 以 返回 对 象 序列 化 之 后 的 
字 节 串 形 式 , 后 者 用 来 把 序列 化 的 字 节 串 反 序列 化 得 到 原始 数据 。 


>>> pickle.dmps([1,2,3]) # 序 列 化 列表 
b"'\x80\x03]q\x00 (K\x01K\ x02K\ x03e." 

>>>picke.dmps ([1,2,3,4]) 

b'\x80\x03]q\x00 (K\xO1K\ x00K\ x03K\ x04e." 

>>>picke.dnps ({1,2,3,4}) # 序 列 化 集合 
b"'\x80\x03cbuiltins\nset\ng\ x00]q\x01 (K\x01K\ x02K\ x03K\ x04e\x85d\ x02Ra\ x03." 
>>>pickle.durps ({1,2,3}) 

b"\x80\x03dbuiltins\nset \nq\ x00]q\x01 (K\x01K\ x00K\x03e\x85q\x00RA\x03." 


>>>pickle.drps ((1,2,3)) # 序 列 化 元 组 
Dr'Nx80Nx03KNAxO1KAx02KNAx03NxBTqNx00.， 

>>> pickle.dumps (123) # 序 列 化 数字 
b'\x80\x03K{." 

>>>pickle.loads( ) # 反 序列 化 


123 
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932 使 用 struct 模块 读 写 二 进 制 文件 


使 用 struct 模块 时 需要 使 用 pack() 方 法 把 对 象 按 指定 的 格式 进行 序列 化 ,然后 使 
用 文件 对 象 的 write() 方 法 将 序列 化 的 结果 写 人 二 进 制 文件 ; 读 取 时 需要 使 用 文件 对 象 
的 read() 方 法 读 取 二 进 制 文件 的 内 容 , 然 后 使 用 struct 模块 的 unpack() 方 法 反 序 列 化 得 
到 原来 的 信息 。 

示例 9-14 使 用 struct 模块 读 写 二 进 制 文件 。 





jimport struct 


IE 1300000000 

六 9%6.45 

ITrue 

于 "al@ 中 国 ' 

anr struct..pack ("if?',n,x,b) # 序 列 化 上 i 表示 整数 ,f 表 示 实 数 ,表示 逻辑 值 


with open('sarple struct.dat', "wb') as f: 
f.write (sn) 


f.write(s.encode()) # 字 符 串 需要 编码 为 字 节 串 再 写 人 文件 


with apen('sample struct.dat', 'zb') as f: 

sm- f.read(9) 

tur= struct .unpack ("if?', sn) # 使 用 指定 格式 反 序列 化 
nxbl=tu # 序 列 解 包 

Print (me vpn, y= ',x, bl= ',bl) 

=f.read(9) 

= 3.decode() # 字 符 串 解码 

Print ('s= ',s) 

在 上 面 的 代码 中 ,首先 读 取 9 个 字 节 然后 进行 反 序列 化 ,再 读 取 9 个 字 节 并 解码 为 字 
符 串 。 后 者 之 所 以 是 9 个 字 节 是 因为 字符 串 的 encode() 方 法 默认 使 用 UTF-8 编码 格式 ， 
使 用 3 个 字 节 表示 一 个 中 文 符号 ,使 用 一 个 字 节 表示 英文 符号 。 而 前 者 之 所 以 是 9 个 字 
节 跟 struct 模块 的 序列 化 规则 有 关 , 每 个 类 型 的 数据 序列 化 时 占用 的 字 节 数 是 固定 的 。 


>>> jimport struct 

>>> struct .pack ("if?',13000, 56.0, True) 
b"'\xc82\x00\x00\x00\x00°B\x01" 

>>> len( ) 

9 

>>> len (struct .pack ("if?", 9999, 5336.0, False)) 
a 

>>> 芝 "ale 中 国 ' 

>>> len(x.encogde () ) 

9 
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933 使 用 sheve 模块 操作 二 进 制 文件 


Python 标准 库 shelve 也 提供 了 二 进 制 文件 操作 的 功能 ,可 以 像 字典 赋值 一 样 来 写 入 
二 进 制 文件 ,也 可 以 像 字 典 一 样 读 取 二 进 制 文件 。 


>>> import shelve 
>>> zhangsan= {'age' :38, 'sex' : 'Male', 'address"' : 'SDIBT'} 
>>> lisi= {'age' :40, 'sex':'Male', 'qgq': "1234567", "tel':"'7654321°'} 
>>>with shelve.open('shelve test.dat') as 印 : 
fp['zhangsan']= zhangsan # 以 字典 形式 把 数据 写 人 文件 
印 [ "lisi"]= lisi 
for i in range(5): 
fp[str(i)]= str(i) 
>>> with shelve.open('shelve test.dat') as fp: 
Print (fp['zhangsan']) # 读 取 并 显示 文件 内 容 
Print (fp['zhangsan'] ["age']) 
Print (fp["lisi']['qg"]) 
Print (fp["3"]) 


{'sex': 'Male', 'address': 'SDIBT', 'age': 38} 
38 

1234567 

3 


934 其 他 常见 类 型 二 进 制 文件 操作 案例 


示例 9-15 使 用 Python 扩展 库 xlwt 把 数据 写 入 Excel 2003 或 更 低 版 本 的 文件 , 然 
后 用 扩展 库 xlrd 读 取 并 输出 显示 。 


fram xlwt import * 
import xlrd 


book= Workbook () # 创 建新 的 Excel 文件 
shestl= book.add sheet ("First") # 添 加 新 的 worksheet 
al=Aligment () 

al .horz= Aligrment. .HORZ_ CENTER # 对 齐 方式 

al.vert= Aligrment .VERT CENIER 

borders= Borders() 

borders.bottam Borders.THICK # 边 框 样式 
style=xEStyle() 

style.alignment= al 

Style.borders=borders 

row= sheet1.row (0) # 获 取 第 0 行 
row.write (0, "test', style— style) # 写 人 单元 格 
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row= shest1.row (1) 
for i in range(5): 


row.write (i,i,style= style) # 写 人 数字 
row.write(5, '= SUM(A2:E2) ', style= style) # 写 人 公式 
book.save (r'D:\test.x1s') # 保 存 文件 


book= xlrd.copen workbook(r'D:\test.xls') 
sheet]- bock.sheet by name('First') 
IOow= sheet1.row(0) 

Print (row[0] .value) 

Print (sheet1.row(1) [2] .value) 


示例 9-16 使 用 扩展 库 openpyxl 读 写 Excel 2007 以 及 更 高 版 本 的 文件 。 


import openpyxl 
fram cpenpyxl import Workbook 





fo= r'f:\test.xlsx' # 文 件 名 

Wo= Workbook () # 创 建 工 作 蚕 

ws= 册 .create sheet (title= "你 好 ,世界 ') # 创 建 工作 表 

ws['A1']= ' 这 是 第 一 个 单元 格 ' # 单 元 格 赋值 

ws['B1']= 3.1415926 

wh.save (fn) # 保 存 Excel 文 件 

Wh= apenpyxl.load workbook (fn) # 打 开 已 有 的 Excel 文 件 
ws= wh.worksheets [1] # 打 开 指定 索引 的 工作 表 
print (ws['Al'] .value) # 读 取 并 输出 指定 单元 格 的 值 
ws.append ([1,2,3,4,5]) # 添 加 一 行 数据 
ws.merge oells('F2:F3') # 合 并 单元 格 

ws['F2']= "= sum(A2:E2)" # 写 人 公式 


for r in range (10,15) : 
for c in range(3,8) : 
_=w3.081] (row= rrcolumn= c,value=r* c) # 写 人 单元 格 数据 
wh.save (fn) 


假设 某 学 校 所 有 课程 每 学 期 允许 多 次 考试 ,学 生 可 随时 参加 考试 ,系统 自动 将 每 次 成 


绩 添 加 到 Excel 文件 (包含 3 列 : 姓名 、 课 程 、 成 绩 ) 中 , 现 期 末 要 求 统计 所 有 学 生 每 门 课 
程 的 最 高 成 绩 。 下 面 的 代码 首先 模拟 生成 随机 成 绩 数据 ,然后 进行 统计 分 析 。 


jimport openpyxl 
fram apenpyxl import Workbook 
import randcm 


# 生 成 随机 数据 
def generatsRandcmInformation (filename) : 
Workbook= Werkbook() 





第 9 章 数据 永久 化 : 文件 内 容 操作 入 201 
四 


worksheet= workbook.worksheets[0] 
worksheet.append([" 姓 名 … "课程 ,成绩 中) 


# 中 文 名 字 中 的 第 一 、 第 二 ,第 三 个 字 
first= ' 赵 钱 孙 李 ' 
midaler " 伟 易 琛 东 ' 
last= ' 坤 艳 志 ' 
subjects= (" 语 文 ， 数学" 英语) 
for i in range (200) : 
line= [] 
I= Iandcom.randint (1, 100) 
name= Iandcm.choice (first) 
# 按 一 定 概率 生成 只 有 两 个 字 的 中 文 名 字 
if r> 50: 
name= name + randcmchoice (middle) 
name= name + randem.choioe (last) 
# 依 次 生成 姓名 ,课程 名 称 和 成 绩 
line.append (name) 
line.append (random.choice(subjects)) 
line.append (random.randint (0,100)) 


worksheet .append (line) 
# 保 存 数据 ,生成 Excel 2007 格 式 的 文件 
Workbook.save (filename) 


def getResult (oldfile, newfile) : 
# 用 于 存放 结果 数据 的 字典 
result= dict() 


# 打 开 原始 数据 
Workbook= cpenpyx] .load workbook (oldfile) 
worksheet= workbook.worksheets [0] 


# 遍 历 原始 数据 
for row in worksheet.rows: 
if row[0].value== ' 姓 名 ': 
continue 
# 姓 名 、 课 程 名 称 、 本 次 成 绩 
name, subject, grade= row[0] .value,row[1] -value, row[2] .value 


# 获 取 当 前 姓名 对 应 的 课程 名 称 和 成 绩 信息 

# 如 果 result 字 典 中 不 包含 , 则 返回 空 字典 

t= result.get (name, {}) 

# 获 取 当 前 学 生 当 前 课程 的 成 绩 , 若 不 存在 ,返回 0 
Et.get (subject,0) 

# 只 保留 该 学 生 该 课程 的 最 高 成 绩 
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证 gradey f: 
t[subject]= grade 
result Iname]=t 


Workbookl= Workibook () 
Worksheet]= workbook] .worksheets [0] 
worksheet1.append([" 姓 名 ', ' 课 程 ',' 成 绩 ']) 


# 将 result 字 典 中 的 结果 数据 写 人 Excel 文件 
for name,t in result.items(): 
Print (amevt) 
for subject, grade in t.items(): 
worksheet1.append ( [name, subject, grade]) 


Workbook] .save (newfile) 


newfile=r'd:\result .xlsx' 
generateRandomInformation (oldfile) 
getResult (oldfile,newfile) 


示例 9-17 把 记事 本 文件 test. txt 转换 成 Excel 2007+ 文件 。 假 设 test. txt 文件 中 
第 一 行为 表 头 ,从 第 二 行 开始 是 实际 数据 ,并 且 表 头 和 数据 行 中 的 不 同 字段 信息 都 是 用 去 


号 分 隔 。 


fram openpyx] import Workbook 


Gef main (txtFileName) : 
new XlsxFileName= txtFileName[:- 3] + 'xlsx' 
Wh= Workbook () 
ws= wb.worksheets[0] 
with cpen (txtFileName) as fp: 
for line in fp: 
line= line.strip() .split(",') 
ws.append (line) 
wh.save (new XlsxFileName) 


main('test.tzxt') 


示例 9-18 检查 Word 文档 的 连续 重复 字 , 如 “用 户 的 的 资料 ”或 “需要 需要 月 


日 户 输 





入 ”之 类 的 情况 。 本 例 使 用 扩展 库 python-docx 读 写 Word 20071 文 档 的 内 容 。 


fram dbcx import Document 


doc= Document (《 Python 程序 设 计 开发 宝典 》.docs') 





contents= '' .join( (p.text for p in doc.paragraphs)) 


words= [] 
for index, dh in enumerate (contents[:- 2]): 
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if dr =contents[index+ 1] or ct = oontents[indext 2]: 


word= oontent's [index: indezet 3] 
if word not in words: 
words.append (word) 
Print (word) 


示例 9-19 提取 docx 文档 中 的 例题 ,插图 和 表格 清单 。 


fram docx import Document 
import re 


result= {'1i':[], "fig':[], 'tab':[]} 
doc= Document (r'C:\Python 可 以 这 样 学 .docx') 


for p in doc.paragraphs: 

t=p.text 

if re-match(" 例 \dt- \dt ',t): 
result ['1i'] .append(t) 

elif re-match(" 图 \dr- \dt ',t): 
result["fig'] .append (t) 

elif re-match(" 表 \dt- \dt ',t): 
result["tab'] .append(t) 


for key in result.keys() : 
Print ('="* 30) 
for value in result [key]: 
Print (value) 


# 遍 历 文档 所 有 段落 
# 获 取 每 一 段 的 文本 
# 例 题 
# 插 图 


# 表 格 


# 输 出 结果 


示例 9-20 ”使 用 密码 字典 暴力 破解 RAR 或 ZIP 文件 密码 。 

本 例 使 用 标准 库 zipfile 和 扩展 库 unrar 实现 主要 功能 。 如 果 下 面 的 代码 不 能 运行 ， 
需要 做 两 个 操作 : @D 到 http://www. rarlab. com/rar/UnRARDLL. exe 下 载 并 安装 
unrardll 库 ,然后 根据 需要 把 安装 文件 夹 中 的 UnRAR. dll 或 x64\ UnRAR64. dll 文件 复 
制 到 unrar 安装 文件 夹 ( 例 如 ,C:\Python 3. 5\Lib\site-packages\unrar) 中 ; @ 打 开 unrar 
安装 文件 夹 中 的 unrarlib. py 文件 ,把 第 43 行 lib_path 二 lib_path or find_library 
("unrar,. dll") 直 接 改 为 unrarlib 二 ctypes. WinDLL(r"C:\Python 3. 5\Lib\site-packages 
\unrar\UnRAR64. dll") ,并 把 接 下 来 的 两 行 代码 删除 或 注释 。 


import os 
jimport sys 
import zipfile 
try: 
from unrar import rarfile 


# zipfile 是 标准 库 


# 和 尝试 导 和 人 扩展 库 , 如 果 没 有 就 临时 安装 
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except: 
Fathr "+ceathdimere(eye-eseautablej+ \\scripts\\pip" install -Upgrade pipy 
08.3ystem(path) 
Fathr "+ ce.path.dimeme (sys-executable)+ "\\scripts\\pip" install unrar' 
os.system(path) 


fram unrar import rarfile 


Gef decryptRarzipFile (filename) : 
if filename.endswith(' .zip'): 
fp- zipfile.ZipFile (filename) 
elif filename.endswith('.rar'): 
fer rarfile.RarFile (filename) 
desFathr filename[:- 4] # 解 压缩 的 目标 文件 夹 
if not os.path.exists (desPath) : 
os.mkdir (desPath) 
try: 尝试 不 用 密码 解压 缩 
名 .extractall (desPath) 
fp.close() 
print ('No password') 
retum 
except: # 使 用 密码 字典 进行 暴力 破解 
try: 
fpPwd open (‘pwodict.txt') 
except: 
print ('No dict file pwidict.tixt in current directory.') 
retum 
for pwd in fpPwd: 
Pu pwd.rstrip() 
try: 
if filename.endswith(' .zip'): 
for file in fp.namelist(): # 重 新 编码 再 解码 ,避免 中 文 乱码 
印 .extract (file,path= desPath,pwd- pwd.encode ()) 
os.rename (desPatht '\\'+ file, 





desPath+ ' \\ "+ file. encode (' cp437 ' ) . decode 
("gbk' ) ) 

print ('Sucoess!====> '+pwd) 

fp.closel() 

break 


elif filename.endswith(' .rar'): 
fp.extractall eathr desPath,pwd- pwd) 
print ('Sucosss!====> '+ pd) 
fp.close() 
break 
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Pass 
fpPwd.close() 


if os.path.isfile (filename) and filename.endswith(('.zip','.rar')): 
decryptRarzZipFile (filename) 

else: 
print ("Must be Rar or Zip file') 


示例 9-21 使 用 Python 标准 库 tarfile 把 当前 文件 夹 中 所 有 . py 文件 压缩 为 gzip 格 
式 的 压缩 文件 ,然后 再 解压 缩 到 指定 文件 夹 中 。 


import os 
jimport tarfile 


with tarfile.open('sanple.tar', 'w:gz') as tar: 
for name in [f for f in os.listdir('.') if f.endswith(' .py')]: 
tar.add (name) 


with tarfile.open('sanple.tar', 'r:gz') as tar: 
tar.extractall (path= 'sarple') 


示例 9-22 批量 提取 普通 PDF 文件 中 的 文本 并 转换 为 TXT 记事 本 文件 。 
本 例 需 要 首先 使 用 pip install pdfminer3k 安装 扩展 库 pdfminer3k ,然后 可 以 使 用 命 
令 行 工 具 pdf2txt. py 对 PDF 文件 进行 转换 ,下 面 的 代码 将 其 封装 起 来 实现 批量 转换 。 


import os 
import sys 
jimport time 


Pafs= (pdfs for pdfs in os.1istdir('.') if pdfs.endswith('.paf')) 


for pdfl in pdfs: 
# 替 换文 件 中 的 指定 字符 
Pd pdfl.replace(' ','_') .replace('- ','_') .replace('&"','_') 
05.rename (pdfl,pdf) 
Print (= '* 30+ "\n',paf) 


txt=pdf[:- 4] + "txt' 
exe= '™! + sys-executable + "~ ™ 
pdf2txt= 0s.path.dimame (sys.executable) 
Paf2bxt- pdf2bd + '\\scripts\\pdfE2txt .py" -o 
try: 

# 调 用 命令 行 工具 paf2bt.PY 进 行 转换 
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# 如 果 paf 加 密 过 ,可 以 改写 下 面 的 代码 
# 在 -o 前 面 使 用 -P 来 指定 密码 
amdF exe +pdf2txt + txt +' ' +pdf 
os.popen am) 
# 转 换 需 要 一 定时 间 ,一 般 小 文件 2 足够 了 
time.sleep(2) 
# 输 出 转换 后 的 文本 ,前 200 个 字符 
with apen (txt,encoding= "utf- 8') as 印 : 
Print (fp.read(200)) 

exospt: 

pass 


本 章 小 结 


(1) 文件 是 长 久保 存 信息 并 允许 重复 使 用 和 反复 修改 ,同时 也 是 信息 交换 的 重要 

(2) 二 进 制 文件 无 法 使 用 记事 本 直接 打开 并 正常 阅读 和 修改 ,必须 使 用 相应 的 软件 
进行 有 关 操 作 。 

(3) 文本 文件 和 二 进 制 文件 的 操作 流程 是 一 样 的 ,首先 打开 文件 并 创建 文件 对 象 , 然 
后 通过 该 对 象 提供 的 方法 对 文件 内 容 进 行 读 取 、 写 入 删除, 修改 等 操作 ,最 后 关闭 并 保存 
文件 内 容 。 

(4) 进行 文件 内 容 的 读 写 操作 时 推荐 使 用 上 下 文 管理 语句 with。 

(5) Python 中 常用 的 二 进 制 文 件 序列 化 模块 有 struct、pickle、shelve 和 marshal。 


习 题 


9.1 假设 有 一 个 英文 文本 文件 ,编写 程序 读 取 其 内 容 , 并 将 其 中 的 大 写字 母 变 为 小 
写字 母 ,小 写字 母 变 为 大 写字 母 。 

9.2 编写 程序 ,使 用 pickle 模块 将 包含 学 生成 绩 的 字典 保存 为 二 进 制 文件 ,然后 读 
取 内 容 并 显示 。 

9.3 简单 解释 文本 文件 与 二 进 制 文件 的 区 别 。 
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第 9 章 介 绍 了 文本 文件 和 二 


进 制 文件 的 内 容 级 操作 ,本 章 重 点 介绍 文件 级 别 的 操作 ， 


例如 人 遍历、 复制 .删除 、 压 缩 、 重 命名 等 ,以 及 文件 与 文件 夹 操作 在 系统 运 维 中 的 应 用 。 


10.1 os 模 块 


Python 标准 库 的 os 模块 除了 提供 使 用 操作 系统 功能 和 访问 文件 系统 的 简便 方法 之 
外 ,还 提供 了 大 量 文件 与 文件 夹 操作 的 方法 ,如 表 10-1 所 示 。 


表 10-1 os 模块 的 方法 




















方法 功能 说 明 
chdir(path) 把 path 设 为 当前 工作 目录 
Nem how gal Tm | 改变 文件 的 访问 权 了 
curdir 当前 文件 夹 
extsep 当前 操作 系统 所 使 用 的 文件 扩展 名 分 隔 符 
getcwd() 返回 当前 工作 目录 
listdirCpath) 返回 path 目录 下 的 文件 和 目录 列表 





mkdir(path[, mode=0777]) 


创建 目录 ,要 求 上 级 目录 必须 存在 





makedirs (pathl/path2*…, mode= 


511) 


创建 多 级 目录 ,会 根据 需要 自动 创建 中 间 缺 失 的 目录 





rmdir(path) 


删除 目录 ,目录 中 不 能 有 文件 或 子 文件 夹 





remove( path) 


删除 指定 的 文件 ,要 求 用 户 拥有 删除 文件 的 权限 ,并 且 文 件 没有 
只 读 或 其 他 特殊 属性 





removedirs(pathl/path2*…) 


删除 多 级 目录 ,目录 中 不 能 有 文件 





rename(src, dst) 


重 命 名 文件 或 目录 ,可 以 实现 文件 的 移动 , 若 目 标 文件 已 存在 则 
抛 出 异常 ,不 能 跨越 磁盘 或 分 区 





replace(old, new) 


重 命名 文件 或 目录 , 若 目 标 文件 已 存在 则 直接 覆盖 ,不 能 跨越 磁 
盘 或 分 区 
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续 表 





方法 功能 说 明 





scandir(path=". ) 


返回 包含 指定 文件 夹 中 所 有 DirEntry 对 象 的 迭代 对 象 ,遍历 文 
件 夹 时 比 listdir() 更 加 高 效 





startfile(filepath [, operation]) 使 用 关联 的 应 用 程序 打开 指定 文件 或 启动 指定 应 用 程序 





stat(path) 返回 文件 的 所 有 属性 





system() 启动 外 部 程序 








下 面 通 过 几 个 示例 来 演示 os 模块 的 基本 用 法 。 


>>> jmport os 

>>> import os.path 

>>> 08.reneme ('C:\\dfg.txt', 'D:\\test2.txt') #rename() 可 以 实现 文件 的 改名 和 移动 

>>> [fname for fname in os.listdir('.') \ # 查 看 当前 文件 夹 中 指定 类 型 的 文件 
if fname.endswith(('.pyc', '.py','-pyw'))] # 结 果 略 

>>> os.getcwd() # 返 回 当 前 的 工作 目录 

'C:\\Python35' 

>>> os mkdir (0s.getcwd()+ \\terp') # 创 建 目录 

>>> os.chdir(os.getcwd()+ "\\temp') # 改 变 当 前 工作 目录 

>>> os.getcwd() 


‘C:\\Python35\ \terp’ 

>>> os.mkdir (os.getcwd()+ '\\test') 

>>> os.listdir('.') 

['test'] 

>>> os.mdir ('test') # 删 除 目 录 
>>> os.1listdir('.') 

0 


>>> os.environ.get ('path') # 获 取 系 统 变 量 Path 的 值 
>>> jimport time 
>>> time.strftime ('%Y- Sm- Sd%H:%M:sS', # 查 看 文件 的 创建 时 间 


time.localtime (0s.stat ('yilaizhuru?.py') .st_ctime)) 
"2016- 10- 18 15:58:57" 
>>> 09.startfile('notepad.exe') # 启 动 记事 本 程序 


下 面 的 代码 使 用 os 模块 的 scandir() 输 出 当前 文件 夹 中 的 所 有 扩展 名 为 py 的 文件 。 


for entry in os.scandir(): 
if entry.is file and entry.name.endswith('.py'): 
Print (entry.name) 
如 果 需 要 遍历 指定 目录 下 所 有 子 目录 和 文件 ,可 以 使 用 递归 的 方法 。 
fram os import listdir 


fram os.path import join,isfile, isdir 


def listDirDepthFirst (directory) : 
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""!' 深 度 优先 遍历 文件 夹 '"' 
# 遍 历 文件 夹 ,如 果 是 文件 就 直接 输出 
# 如 果 是 文件 夹 ,就 输出 显示 ,然后 递归 遍历 该 文件 夹 
for subPath in listdir (directory): 
path= join (directory, subPath) 
if isfile(path): 
Print (path) 
elif isdir (path) : 
Print (path) 
listDirDepthFirst (path) 
上 面 的 代码 使 用 深度 优先 的 遍历 方法 ,而 下 面 的 代码 则 使 用 了 广度 优先 遍历 方法 。 


fram os import listdir 
fram os.path import join, isfile,isdir 


Gef listDirWidthFirst (directory) : 
""' 广 度 优先 遍历 文件 夹 '"' 
# 使 用 列表 模拟 双 端 队列 ,效率 稍微 受 影响 ,不 过 关系 不 大 
dirs= [directory] 
# 如 果 还 有 没 遍 历 过 的 文件 夹 ,继续 循环 
while dirs: 
# 遍 有 历 还 没 遍 历 过 的 第 一 项 
current= dirs.pop(0) 
# 遍 历 该 文件 夹 ,如 果 是 文件 就 直接 输出 显示 
# 如 果 是 文件 夹 ,输出 显示 后 ,标记 为 待 遍 历 项 
for subPath in listdir (current): 
Path= join (current, subPath) 
if isfile (path): 
Print (path) 
elif isdir (path): 
Print (path) 
dirs.append (Path) 


10. 2 os.path 模块 


os. path 模块 提供 了 大 量 用 于 路 径 判断 、 切 分 .连接 以 及 文件 夹 遍历 的 方法 ,如 表 10-2 


所 示 。 
表 10-2 os. path 模块 的 方法 

















邦 潜 功能 说 明 
abspath( path) 返回 给 定 路 径 的 绝对 路 径 
basename( path) 返回 指定 路 径 的 最 后 一 个 组 成 部 分 
commonpath(paths) ”| 返回 给 定 的 多 个 路 径 的 最 长 公共 路 径 
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方 法 功能 说 明 
commonprefix(paths) | 返回 给 定 的 多 个 路 径 的 最 长 公共 前 组 
dirname(p) 返回 给 定 路 径 的 文件 夹 部 分 
exists(path) 判断 文件 是 否 存在 
getatime(filename) 返回 文件 的 最 后 访问 时 间 
getctime(filename) 返回 文件 的 创建 时 间 
getmtime(filename) 返回 文件 的 最 后 修改 时 间 
getsize(filename) 返回 文件 的 大 小 
isabs( path) 判断 path 是 否 为 绝对 路 径 
isdirCpath) 判断 path 是 否 为 文件 夹 
isfileCpath) 判断 path 是 否 为 文件 
join(path, *paths) 连接 两 个 或 多 个 path 
split( path) 以 路 径 中 的 最 后 一 个 斜 线 为 分 隔 符 把 路 径 分 隔 成 两 部 分 ,以 列表 形式 返回 
splitext(path) 从 路 径 中 分 隔 文件 的 扩展 名 
splitdrive( path) 从 路 径 中 分 隔 驱 动 器 的 名 称 
>>> path= 'D:\ \mypython exp\\new test.txt' 
>>> os.path.dimame (path) # 返 回路 径 的 文件 夹 名 
'D:\\mypython exp' 
>>> os.path.basename (path) # 返 回路 径 的 最 后 一 个 组 成 部 分 
'new_test.txt" 
>>> os-path.split (path) # 切 分 文件 路 径 和 文件 名 
('D:\\mypython exp', 'new test.tzxt') 
>>> os.path.split ("') # 切 分 结果 为 空 字符 串 
(vv 
>>> o8.path.split ('C:\ \windows') # 以 最 后 一 个 斜 线 为 分 隔 符 
('C:\\', wingows') 
>>> os.path.split ('C:\\windows\\') 
('C:\\wingows', '') 
>>> os .path.splitdrive (path) # 切 分 驱动 器 符号 
('D:','\\mypython exp\\new test.tzxt') 
>>> os.path.splitext (path) # 切 分 文件 扩展 名 
('D:\ \mypython exp\\new test',' .txt') 
>>> os .path.cmmonpath ([r'C:\windows\notepad.exe',r'C:\windows\system']) 
'C:\\wingdows' 
>>> os.path.commonpath ([r'a\b\c\d',r'a\b\c\e']) # 返 回路 径 中 的 共同 部 分 
'a\\b\\c' 


>>> os.path.commonprefix([r'a\b\c\d',r'a\b\c\e']) # 返 回 字符 串 的 最 长 公共 前 绥 
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'a\\b\\o\' 

>>> os.path.realpath ('tttt.py') # 返 回绝 对 路 径 

'C:\\Python 3.5\\tttt.py’ 

>>> os.path.abspath('tttt.py') # 返 回绝 对 路 径 

'C:\\Python 3.5\Ntttt.PY" 

>>> os.path.relpath('C:\\windows\ \notepad.exe') # 返 回 相 对 路 径 

'.\\windows\ \notepad.exe' 

>>> os.path.relpath ('D:\ \windows\ \notepad.exe') # 相 对 路 径 不 能 跨越 分 区 
Valuegrror: path is cn mount 'D:",start on mount 'C:" 

>>> os.path.relpath('C:\ \windows\ \notepad.exe', 'dlls') # 指 定 相对 路 径 的 基准 位 置 


"NAN\.N\Nwindows\N\notepad.exe" 


10.3 ”shutil 模块 


shutil 模块 也 提供 了 大 量 的 方法 支持 文件 和 文件 夹 操 作 , 常 用 方法 如 表 10-3 所 示 。 
表 10-3 ”shutil 模块 的 常用 方法 











方 法 功能 说 明 
复制 文件 ,新 文件 具有 同样 的 文件 属性 ,如 果 目 标 文件 已 存在 则 
copy(src, dst) 
抛 出 异 党 
Dy 复制 文件 ,新 文件 具有 与 原文 件 完全 一 样 的 属性 ,包括 创建 时 间 、 
Be 修改 时 间 和 最 后 访问 时 间 等 ,如 果 目 标 文件 已 存在 则 抛 出 异常 
copyfileCsre, dst) 复制 文件 ,不 复制 文件 属性 ,如 果 目 标 文件 已 存在 则 直接 覆盖 





在 两 个 文件 对 象 之 间 复制 数据 ,例如 


fileobj(fsrc, f. 
copyfileob)(fere, fdst) copyfileobj(open('123. txt), open(456. txt', ‘a)) 





把 src 的 模式 位 (mode bit) 复 制 到 dst 上 ,之 后 两 者 具有 相同 的 

















copymode(src，dst) 模式 

copystat(src，dst) 把 src 的 模式 位 访问 时 间 等 所 有 状态 都 复制 到 dst 上 
copytree(src，dst) 递归 复制 文件 夹 

disk_usage( path) 查看 磁盘 的 使 用 情况 

movelsrc, dst) 移动 文件 或 递归 移动 文件 夹 , 也 可 以 给 文件 和 文件 夹 重 命名 
rmtree( path) 递归 删除 文件 夹 





make_archive( base_name, format, 
root_dir= None, base_dir= None) 


创建 TAR 或 ZIP 格式 的 压缩 文件 





Unpack archive( filenane ， extract_ 解压 缩 压缩 文件 
dir= None, format= None) 








下 面 的 代码 演示 了 如 何 使 用 标准 库 shutil 的 copyfile() 方 法 复制 文件 : 


>>> import shutil # 导 入 shutil 模 块 
>>> shutil.copyfile('C:\\dir.txt', 'C:\\dirl.txt') # 复 制 文件 
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下 面 的 代码 将 C:\Python35\Dlls 文件 夹 以 及 该 文件 夹 中 所 有 文件 压缩 至 D:\a. zip 
文件 : 


>>> shutil .make archive('D:\\a', 'zip', 'C:\\Python35', "Dl1s') 
'D:\\a.zip' 


下 面 的 代码 将 刚 压缩 得 到 的 文件 D:\a. zip 解压 缩 至 D:\a_unpack 文件 夹 : 
>>> shutil .unpack archive('D:\\a.zip', 'D:\\a_unpack') 

下 面 的 代码 使 用 shutil 模块 的 方法 删除 刚刚 解压 缩 得 到 的 文件 夹 : 

>>> shutil.mtree('D:\\a_unpack') 


Python 标准 库 shutil 的 rmtree() 函数 还 支持 更 多 的 参数 。 例 如 ,可 以 使 用 onerror 
参数 指定 回调 函数 来 处 理 删除 文件 或 文件 夹 失败 的 情况 : 


>>> import os 
>>> import stat 
>>> import shutil 
>>> def remove_readonly (func,path, ): # 定 义 回调 函数 
os.chmod (path, stat.S_IRRITE) # 删 除 文件 的 只 读 属 性 
func (path) # 再 次 执行 删除 操作 
>>> shutil.mtree('D:\\des_test') # 文 件 夹 中 有 个 只 读 文件 ,删除 
失败 


PemissionError: [WinError 5] 拒绝 访问 。: 'D:\\des_test\\testl.txt' 
>>> shutil.mtree('D:\\des_ test',onerror= remove_readonly) 
# 指 定 回调 函数 ,删除 成 功 
下 面 的 代码 使 用 shutil 的 copytree() 函 数 递 归 复 制 文件 夹 , 并 忽略 扩展 名 为 pyc 的 
文件 和 以 “新 " 字 开 头 的 文件 及 子 文件 夹 : 
>>> fram shutil import copytreeyignore pattems 
>>> oopytree('C:\\python35\\test', 'D:\\des_test', 
jignorer ignore pattems('* .pycv "新 * ')) 


10.4 精彩 案例 赏析 


示例 10-1 把 指定 文件 夹 中 的 所 有 文件 名 批量 随机 化 ,保持 文件 类 型 不 变 。 


fram string import ascii letters 
fram os import listdir, rename 

fram os.path import splitext, join 
fram random import choioe, randint 


def randcomFilename (directory) : 
for fn in listdir (directory) : 
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# 切 分 ,得 到 文件 名 和 扩展 名 

nameyvext= splitext (fn) 

m= randint (5, 20) 

# 生 成 随机 字符 串 作 为 新 文件 名 

newName= '' .join( (choioe (ascii letters) for i in rangeo))) 
# 修 改 文件 名 

Tename (join (directory, fn) , join (directory, newNamet ext)) 


randomFilename ('C:\\test') 


示例 10-2 编写 程序 ,进行 文件 夹 增 量 备份 。 

程序 功能 与 用 法 : 指定 源 文件 夹 与 目标 文件 夹 ,自动 检测 自 上 次 备份 以 来 源 文件 夹 
中 内 容 的 改变 ,包括 修改 的 文件 .新 建 的 文件 .新 建 的 文件 夹 等 ,自动 复制 新 增 或 修改 过 的 
文件 到 目标 文件 夹 中 , 自 上 次 备份 以 来 没有 修改 过 的 文件 将 被 忽略 而 不 复制 ,从 而 实现 增 
量 备 份 。 本 例 属于 系统 运 维 的 范畴 。 


jimport os 
import filearp 
import shutil 
import sys 


def autcBackup (scrDir,dstDir) : 
if ((not os.path.isdir(scrDir)) or (not os.path.isdir (dstDir)) or 
(os.path.abspath (scrDir) != scrDir) or 
(os.path.abspath (dstDir) != dstDir)): 
usage() 
for item in os.listdir(scrDir) : 
scrItem= os.path.join (scrDir,item) 
dstItem= scrItem.replace (scrDir, dstDir) 
if os.path.isdir (scrItem) : 
# 创 建新 增 的 文件 夹 ,保证 目标 文件 夹 的 结构 与 原始 文件 夹 一 致 
if not os.path.exists (dstItem) : 
cs.makedirs (dstItem) 
Print (make directory'+ dstItem) 
# 递 归 调用 自身 函数 
autcBackup (scrTtem, dstTtem) 
elif os.path.isfile (scrItem) : 
# 只 复制 新 增 或 修改 过 的 文件 
if ((not os.path.exists (dstTtem) ) or 
(et fileamp.amp (scrTtem, dstTtem, shallow= False))): 
shutil .copyfile (scrTtem, dstItem) 
print ('file:'+ scrTtemt ==> '+dstTtem) 
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Gef usage(): 
Print ('scrDir and dstDir mst be existing sbeclute path of certain directory') 
print ('For exenple: {0} c:\\olddir c:\Nnewdir'.format (sys.argv[0])) 
3y3.exit (0) 


ScrDir, dstDir= sys.argv[1],sys.argv[2] 
autoBackup (scrDir, dstDir) 


示例 10-3 ”编写 程序 ,统计 指定 文件 夹 大 小 以 及 文件 和 子 文件 夹 数 量 。 本 例 也 属于 
系统 运 维 范 畴 ,可 用 于 磁盘 配额 的 计算 ,例如 E-mail、 博客 .FTP. 快 盘 等 系统 中 每 个 账号 
所 占 空间 大 小 的 统计 。 


import os 


totalSize=0 
fileNm=0 
dirNum0 


Gef visitDir (path) : 
glcbal totalsize 
global fileNum 
glcbal dirNm 
for lists in os.listdir (path) : 
sub Path= os.path.join (path, lists) 
if os.path.isfile(sib path): 


fileNume fileNumt 1 # 统 计 文 件数 量 
totalSizer totalSizet os.path.getsize (stb path) # 统 计 文 件 总 大 小 
elif os.path.isdir (sub Path) : 
dirName dirNumt 1 # 统 计 文 件 夹 数量 
visitDir (sub path) # 递 归 遍 有 历 子 文件 夹 
def main (path) : 
if not os.path.isdir (path) : 
print ('Error:"',path, '" is not a directory or does not exist.') 
retum 
visitDir (path) 
aef sizeConvert (size) : # 单 位 换算 


K,M,G= 1024,1024%* 关 2,1024x 关 3 


if size >=G: 
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Teturn str(size/G)+ 'G Bytes" 
elif size >=M: 

Teturn str(size/M+ 'M Bytes' 
elif size >=K: 

Teturn str (size/K)+ 'K Bytes' 
else: 

Tetum str (size)+ 'Bytes' 


def cutput (path) : 
print ("The total size of '+patht ' is:"+ sizeConvert (totalSize)+ '('+ str (totalSize)+ ' Bytes) ') 
print ("The total number of files in '+patht ' is:',fileNum) 
print ("The total number of directories in '+patht ' is:',dirNum) 


还 ie = ain 全 
Path=r'd:\idapro6.plus' 
main (path) 
output (path) 


示例 10-4 ”编写 程序 ,递归 删除 指定 文件 夹 中 指定 类 型 的 文件 和 大 小 为 0 的 文件 。 


fram os.path import isdir, join, splitext 
fram os import remove, listdir, dmod, stat 


filetypes= ('.trp','.log', .cbj ' .txt') # 指 定 要 删除 的 文件 类 型 
def delCertainFiles (directory) : 
证 not isdir (directory) : 
retum 
for filename in listdir (directory): 
temp= join (directory, filename) 
if isdir (temp) : 
delcertainFiles (tenp) # 递 归 调 用 
elif splitext (temp) [1] in filetypes or stat (temp) .st size==0: 
chmod (temp, 00777) # 修改 文件 属性 ,获取 删除 权限 
Tempve (temp) # 删 除 文件 


print (tempy' deleted** ') 
GelCertainFiles (r'C:\test') 
本 章 小 结 


(1) Python 标准 库 os、os. path 和 shutil 是 文件 与 文件 夹 操作 常用 的 模块 。 
(2) 在 遍历 文件 夹 时 ,有 深度 优先 和 广度 优先 两 种 方法 。 
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(3) 在 遍历 文件 夹 时 ,os. path. join() 函 数 非常 重要 。 
习 题 

10.1 使 用 shutil 模块 中 的 move() 方 法 进行 文件 移动 。 

10.2 编写 代码 ,将 当前 工作 目录 修改 为 *C:\”, 并 验证 ,最 后 将 当前 工作 目录 恢复 
为 原来 的 目录 。 

10.3 编写 程序 ,用 户 输入 一 个 目录 和 一 个 文件 名 ,搜索 该 目录 及 其 子 目 录 中 是 否 存 
在 该 文件 。 

10.4 文件 对 象 的 方法 用 来 把 缓冲 区 的 内 容 写 入 文件 ,但 不 关闭 文件 。 

10.5 os. path 模块 中 的 方法 用 来 测试 指定 的 路 径 是 否 为 文件 。 

10.6 os 模块 的 方法 用 来 返回 包含 指定 文件 夹 中 所 有 文件 和 子 文件 夹 的 


列表 。 


su 
3” 代码 质量 保障 : 异常 处 理 结 





《 ， 构 与 单元 测试 


程序 出 错 是 一 件 非常 难 避 免 的 事情 。 再 厉害 的 程序 员 也 无 法 提前 预见 代码 运行 时 可 
能 会 遇 到 的 所 有 情况 ,几乎 每 个 程序 员 都 被 用 户 说 过 * 你 编 的 那个 软件 不 好 用 啊 ”, 而 程序 
员 经 过 反复 检查 以 后 发 现 问题 的 原因 是 用 户 操作 不 规范 或 者 输入 了 错误 类 型 的 数据 ,于 
是 一 边 修改 代码 加 强 类 型 检查 一 边 抱怨 用 户 不 按 套路 出 牌 。 其 实 呢 , 作 者 个 人 认为 这 样 
的 问题 的 根源 还 是 在 程序 员 而 不 在 用 户 ,程序 员 编 写 代 码 时 有 义务 也 有 必要 考虑 这 些 
特殊 情况 ,因为 大 多 时 候 恰恰 是 少数 特殊 情况 影响 了 整个 系统 的 美感 和 开发 人 员 的 成 
就 感 (二 八 定 律 )。 虽 然 大 部 分 软件 在 发 布 前 一 般 都 经 过 了 严格 的 测试 ,然而 充分 的 测 
试 也 很 难 枚 举 所 有 可 能 出 现 的 情况 ,这 时 异常 处 理 结构 则 是 避免 特殊 情况 下 软件 崩溃 
的 利器 。 

异常 是 指 程序 运行 时 引发 的 错误 ,引发 错误 的 原因 有 很 多 ,如 除 零 、 下 标 越界 ,文件 不 
存在 、 网 络 异 常 等 。 如 果 这 些 错误 得 不 到 正确 的 处 理 将 会 导致 程序 崩溃 并 终止 运行 ,合理 
地 使 用 异常 处 理 结构 可 以 使 得 程序 更 加 健壮 ,具有 更 高 的 容错 性 ,不 会 因为 用 户 不 小 心 的 
错误 输入 而 造成 程序 崩溃 ,也 可 以 使 用 异常 处 理 结构 为 用 户 提供 更 加 友好 的 提示 。 另 外 ， 
有 效 的 软件 测试 方法 能 够 在 软件 发 布 之 前 发 现 尽 可 能 多 的 bug ,而 软件 发 布 之 后 再 出 现 
错误 时 是 否 能 够 调试 程序 并 快速 定位 和 解决 存在 的 问题 则 是 程序 员 综合 水 平和 能 力 的 重 
要 体现 。 


11.1 异常 处 理 结构 


1111 异常 的 概念 与 表现 形式 


当 程 序 执行 过 程 中 出 现 错误 时 Python 会 自动 引发 异常 ,程序 员 也 可 以 通过 raise 语 
句 显 式 地 引发 异常 。 异 常 处 理 是 因为 程序 执行 过 程 中 由 于 输入 不 合法 导致 程序 出 错 而 在 
正常 控制 流 之 外 采取 的 行为 。 严 格 来 说 ,语法 错误 和 人 逻辑 错误 不 属于 异常 ,但 有 些 语法 错 
误 往 往 会 导致 异常 。 例 如 ,由 于 大 小 写 拼写 错误 而 试图 访问 不 存在 的 对 象 , 或 者 试图 访问 
不 存在 的 文件 等 。 当 Python 检测 到 一 个 错误 时 ,解释 器 就 会 指出 当前 程序 流 已 经 无 法 
再 继续 执行 下 去 ,这 时 就 出 现 了 异常 。 代 码 一 旦 抛 出 异常 而 得 不 到 及 时 处 理 , 整 个 程序 就 
会 崩溃 而 提前 结束 ,而 合理 地 使 用 异常 处 理 结构 可 以 使 得 程序 更 加 健壮 ,具有 更 高 的 
容错 性 ,不 会 因为 用 户 不 小 心 的 错误 输入 而 造成 程序 终止 ,也 可 以 使 用 异常 处 理 结构 为 用 
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户 提供 更 加 友好 的 提示 。 
在 前 面 的 章节 中 已 经 多 次 出 现 过 异常 ,想必 大 家 已 经 有 了 初步 的 了 解 。 下 面 是 几 种 
比较 常见 的 异常 的 表现 形式 : 
>>>2/0 # 除 0 错误 
ZeroDivisionError: division by zero 
>>> 'a'+2 # 操 作 数 类 型 不 支持 , 略 去 异常 的 详细 信息 
TypeError: Can't convert 'int' cbject to str implicitly 
>>> {3,4,5H3 # 操 作 数 类 型 不 支持 
TypeError: unsupported operand type(s) for* : "set' and "int' 
>>> print (testStr) # 变 量 名 不 存在 
NameError: name "testStr' is not defined 
>>> fp= apen (r'D:\test.data', "rb') # 文 件 不 存在 
FileNotFoundError: [Errno 2] No such file or directory: 'D:\\test.data' 
>>> len(3) # 参 数 类 型 不 匹配 
TypeError: abject of type 'int' has no len() 
>>> list (3) # 参 数 类 型 不 匹配 


TypeError: 'int' abject is not iterable 


1112 Pthm 内 置 异常 类 层次 结构 


下 面 全 面 展 示 了 Python 内 置 异常 类 的 继承 层次 ,其 中 BaseException 是 所 有 内 置 异 
常 类 的 基 类 。 在 使 用 异常 处 理 结构 捕获 和 处 理 异常 时 ,应 尽量 具体 一 点 ,最 好 是 明确 指定 
要 捕获 和 处 理 哪 一 类 异常 。 建 议 先 尝试 捕获 派生 类 ,然后 再 捕获 基 类 ,应 尽量 避免 直接 捕 
获 Exception 或 BaseException。 

BaseFExosption 

+ 一- SystenExit 
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十 一- SyntaxError 
+—— IndentationError 
+-— TabError 
+ 一 - SystenError 
+ 一 -TYPeError 
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+—— BytesWarning 
+—— ResourosWarning 


1113 异常 处 理 结 构 


Python 提供 了 多 种 不 同形 式 的 异常 处 理 结构 ,基本 思路 都 是 一 致 的 : 先 尝试 运行 代 
码 , 如 果 没有 问题 就 正常 执行 ,如 果 发 生 了 错误 就 尝试 着 去 捕获 和 处 理 ,最 后 实在 没 办 法 
了 才 骨 溃 。 从 这 个 角度 来 看 ,不 同形 式 的 异常 处 理 结构 也 属于 选择 结构 的 变形 。 


1，try…except… 


Python 异常 处 理 结构 中 最 简单 的 形式 是 try…except… 结 构 , 类 似 于 单 分 支 选 择 结 
构 。 其 中 try 子 句 中 的 代码 块 包含 可 能 会 引发 异常 的 语句 ,而 except 子 句 则 用 来 捕捉 相 
应 的 异常 。 如 果 try 子 句 中 的 代码 引发 异常 并 被 except 子 句 捕捉 ,就 执行 except 子 句 的 
代码 块 ; 如 果 try 中 的 代码 块 没有 出 现 异常 就 继续 往 下 执行 异常 处 理 结构 后 面 的 代码 ;如 
果 出 现 异 常 但 没有 被 except 捕获 ,继续 往外 层 抛 出 ;如 果 所 有 层 都 没有 捕获 并 处 理 该 异 
常 ,程序 崩溃 并 将 该 异常 呈现 给 最 终 用 户 。 该 结构 的 语法 如 下 : 
try: 
# 可 能 会 引发 异常 的 代码 , 先 执行 一 下 试 试 
except Exosption[ as reason]: 
# 如 果 try 中 的 代码 抛 出 异常 并 被 except 捕 所, 就 执行 这 里 的 代码 
下 面 的 代码 用 来 接收 用 户 输入 ,并 且 要 求 用 户 必 须 输入 整数 ,不 接收 其 他 类 型 的 
输入 。 


>>> while True: 

= input ('Please input:"') 

try: 
x int (x) 
Print ('You have input {0}" .fomat (x)) 
break 

except Exosption as e: 
Print ('Error.') 


Please input:234c 
Error. 

Please input:5 
You have input 5 


2。ftry…except…else… 


带 有 else 子 句 的 异常 处 理 结构 可 以 看 作 一 种 特殊 的 双 分 支 选 择 结构 ,如 果 try 中 的 
代码 抛 出 了 异常 并 且 被 except 语句 捕 提 则 执行 相应 的 异常 处 理 代 码 , 这 种 情况 下 就 不 会 
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执行 else 中 的 代码 ;如 果 try 中 的 代码 没有 引发 异常 , 则 执行 else 块 的 代码 。 该 结构 的 语 
法 如 下 : 


try: 
# 可 能 会 引发 异常 的 代码 
except Exosption [ as reason]: 
# 用 来 处 理 异常 的 代码 
else: 
# 如 果 try 子 句 中 的 代码 没有 引发 异常 ,就 继续 执行 这 里 的 代码 


例如 ,前 面 要 求 用 户 必须 输入 整数 的 代码 也 可 以 像 这 样 写 ,并 且 这 是 推荐 的 写法 。 也 
就 是 说 ,不 要 把 太 多 代码 放 在 try 中 ,而 是 应 该 只 放 真 的 可 能 会 引发 异常 的 代码 。 


>>> while True: 

六 input ('Please input:') 

try: 
= int (x) 

except Exosption as e: 
print ('Error. ') 

else: 
Print ('You have input {0} .format (x)) 
break 


Please input:888c 
Error. 

Please input:888 
You have input 888 


3. try…except…finally… 


在 这 种 结构 中 ,无 论 try 中 的 代码 是 否 发 生 异 常 ,也 不 管 抛 出 的 异常 有 没有 被 except 
语句 捕获 ,finally 子 句 中 的 代码 总 是 会 得 到 执行 。 所 以 ,finally 中 的 代码 常用 来 做 一 些 清 
理工 作 ,例如 释放 try 子 句 中 代码 申请 的 资源 。 该 结构 的 语法 为 

try: 

# 可 能 会 引发 异常 的 代码 
except Exosption [ as reason]: 

# 处 理 异 常 的 代码 
finally: 

# 无 论 try 子 句 中 的 代码 是 否 引发 异常 ,都 会 执行 这 里 的 代码 


例如 下 面 的 代码 ,不论 是 否 发 生 异 常 ,finally 子 句 中 的 代码 总 是 被 执行 。 


>>> def div(a,b): 
try: 
Print (a/b) 
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except ZeroDivisionError: 
print ("The second Parameter cannot be 0.') 
finally: 
print(-1) 


>>> div(3,5) 
0.6 

= 

>>> div(3,0) 

The second parameter cannot be 0. 
二 有 


如 果 try 子 句 中 的 异常 没有 被 except 语句 捕捉 和 处 理 , 或 者 except 子 句 或 else 子 句 
中 的 代码 抛 出 了 蜡 常 ,那么 这 些 异 常 将 会 在 finally 子 句 执行 完 后 再 次 抛 出 。 


>>> def div(a,b): 
try: 
Print (a/b) 
except ZeroDivisionError: 
Print ("The second Parameter cannot be 0.') 
finally: 
Print (- 1) 


>>> div('3',5) 

二 

此 处 略 去 异常 的 详细 信息 ) 

TypeError: unsupported operand type(s) for /: 'str' and 'int' 

需要 注意 的 是 ,异常 处 理 结构 不 是 万 能 的 ,并 不 是 采用 了 异常 处 理 结构 就 万 事 大 吉 ， 
finally 子 句 中 的 代码 也 可 能 会 引发 异常 。 下 面 代码 的 本 意 是 使 用 finally 子 句 来 避免 文 
件 对 象 没有 关闭 的 情况 发 生 , 但 是 由 于 指定 的 文件 不 存在 而 导致 打开 失败 ,结果 在 finally 
子 名 中 关闭 文件 时 引发 了 异常 ,因为 这 时 并 不 存在 文件 对 象 {1。 


>>> try: 
fl= open('test1.txt', 'r') # 文 件 不 存在 , 抛 出 异常 ,不 会 创建 文件 对 象 生 
line=f1.readline( ) # 后 面 的 代码 不 会 被 执行 
print (line) 

except SyntaxError: # 这 个 except 并 不 能 捕捉 上 面 的 异常 
Print (sth wrong') 

finally: 
所.close() # 也 不 存在 ,再 次 引发 异常 


五 leNotFoundError: [Ermo 2] No such file or directory: "testl.txt' 
During handl ing of the above exception,ancther exception occurred: 
NameFrror: name 'fl' is not defined 
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4. 可 以 捕捉 多 种 异常 的 异常 处 理 结构 


在 实际 开发 中 ,同一 段 代码 可 能 会 抛 出 多 种 异常 ,并 且 需 要 针对 不 同 的 异常 类 型 进行 
相应 的 处 理 。 为 了 支持 多 种 异常 的 捕 提 和 处 理 ,Python 提供 了 带 有 多 个 except 的 异常 处 
理 结构 ,一旦 try 子 句 中 的 代码 抛 出 了 异常 ,就 按 顺 序 依次 检查 与 哪 一 个 except 子 句 匹 
配 , 如 果 某 个 except 捕捉 到 了 异常 ,其 他 的 except 子 句 将 不 会 再 尝试 捕捉 异常 。 该 结构 
类 似 于 多 分 支 选择 结构 ,语法 格式 为 


try: 
# 可 能 会 引发 异常 的 代码 
except Exceptionl: 
# 处 理 异常 类 型 1 的 代码 
except Exoeption2: 
# 处 理 异常 类 型 2 的 代码 
exoapt Exoeption3: 
# 处 理 异常 类 型 3 的 代码 


下 面 的 代码 演示 了 这 种 异常 处 理 结构 的 用 法 ,连续 运行 3 次 并 输入 不 同 的 数据 ,结果 
如 下 : 


>>> try: 
= 了 cat (input(" 请 输入 被 除数 : ')) 
严 float (input(" 请 输入 除数 : )) 
2 X/Y 
except ZeroDivisionError: 
Print ("除数 不 能 为 零 ') 
except TypeError: 
print ("被 除数 和 除数 应 为 数值 类 型 ') 
except NameError: 
print ("变量 不 存在 ') 
else: 
Print (x,'/',y,'= ",2) 


请 输入 被 除数 : 30 # 第 一 次 运行 

请 输入 除数 : 5 

30.0/5.0= 6.0 

请 输入 被 除数 : 30 # 第 二 次 运行 , 略 去 重复 代码 
请 输入 除数 : abc 


ValuesFrror: could not convert string to float: 'abc'" 


请 输入 被 除数 : 30 # 第 三 次 运行 , 略 去 重复 代码 
请 输入 除数 : 0 
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除数 不 能 为 零 


在 实际 开发 中 ,有 时 可 能 会 为 几 种 不 同 的 异常 设计 相同 的 异常 处 理 代码 (虽然 这 种 情 
况 很 少 ) 。 为 了 减少 代码 量 ,Python 允许 把 多 个 异常 类 型 放 到 一 个 元 组 中 ,然后 使 用 一 个 
except 子 句 同时 捕 提 多 种 异常 ,并 且 共 用 同一 段 异常 处 理 代码 。 


>>> try: 
一 卫 oat (input(" 请 输入 被 除数 : ')) 
天 昌 cat (input(" 请 输入 除数 : ')) 
= float(x)/y 
except (ZeroDivisionError, TypeError, NameError) : 
print ("捕捉 到 了 异常 ') 
else: 
Print (x,'/',y,'= ",2) 


请 输入 被 除数 : 30 
请 输入 除数 : 0 
捕捉 到 了 异常 


5. 同时 包含 else 子 句 ,finally 子 句 和 多 个 except 子 句 的 异常 处 理 结构 


Python 异常 处 理 结构 中 可 以 同时 包含 else 子 句 、 多 个 except 子 句 和 finally 子 句 。 
例如 : 


>>> def div(x,y): 
try: 
Print (x/y) 
except ZeroDivisionError: 
Print ('ZeroDivisionError') 
exospt TypeError: 
Print ("TypeError') 
else: 
print ('No Error') 
finally: 
print ("executing finally clause") 


>>> div(3,5) 

0.6 

No Error 

executing finally clause 
>>> div('3',5) 

TypeError 

executing finally clause 
>>> div(3,0) 
ZeroDivisionError 
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executing finally clause 


14 断言 与 上 下 文 管理 语句 


断言 语句 assert 也 是 一 种 比较 常用 的 技术 ,常用 来 在 程序 的 某 个 位 置 确认 某 个 条 件 
必须 满足 。 断 言语 句 assert 仅 当 脚本 的 _debug__ 属 性 值 为 True 时 有 效 ,一 般 只 在 开发 
和 测试 阶段 使 用 。 当 使 用 优化 选项 -o 或 -oo 把 Python 程序 编译 为 字 节 码 文件 时 ,assert 
语句 将 被 删除 。 


>>>e3 
>>>b=5 
>>> assert a==b, 'a mst be equal to b' 


AssertionError: a mst be equal tob 
>>> try: 
assert a==b, 'a mst be equal to b' 
except AssertionError as reason: 
Print(" s:%s'% (reason. _class name _,reason)) 


AssertionError:a mst be equal tob 


上 下 文 管理 (context manager) 语 句 with 可 以 自动 管理 资源 ,不 论 因 为 什么 原因 ( 哪 
怕 是 代码 引发 了 异常 ) 跳 出 with 块 , 总 能 保证 文件 被 正确 关闭 ,并 且 可 以 在 代码 块 执行 完 
毕 后 自动 还 原 进 入 该 代码 块 时 的 现场 ,常用 于 文件 操作 、 数 据 库 连接 、 网 络 通信 连接 和 多 
线程 ,多 进程 同步 等 场合 。 


11.2 单元 测试 unittest 


软件 测试 对 于 保证 软件 质量 非常 重要 ,尤其 是 升级 过 程 中 不 应 影响 系统 原来 的 用 法 ， 
是 未 来 重 构 代码 的 信心 保证 。 一 般 来 说 稍微 有 些 规模 的 软件 公司 都 有 专门 的 测试 团队 来 
保证 软件 质量 ,但 作为 程序 员 ,首先 应 该 保证 自己 编写 的 代码 准确 无 误 地 实现 了 预定 功能 。 

软件 测试 的 方法 有 很 多 ,从 软件 工程 角度 来 讲 ,可 以 分 为 白 盒 测试 和 黑 盒 测试 两 大 
类 。 其 中 , 白 盒 测试 主要 通过 阅读 程序 源 代码 来 判断 是 否 符合 功能 要 求 , 对 于 复杂 的 业务 
逻辑 白 盒 测试 难度 非常 大 ,一 般 以 黑 盒 测 试 为 主 , 白 盒 测 试 为 辅 。 黑 盒 测 试 不 关心 模块 的 
内 部 实现 方式 ,只 关心 其 功能 是 否 正确 .通过 精心 设计 一 些 测 试用 例 来 检验 模块 的 输入 和 
输出 是 否 正确 ,最 终 判 断 是 否 符合 预定 的 功能 要 求 。 

单元 测试 是 保证 模块 质量 的 重要 手段 之 一 ,通过 单元 测试 来 管理 设计 好 的 测试 用 例 ， 
不 仅 可 以 避免 测试 过 程 中 人 工 反 复 输 入 可 能 引入 的 错误 ,还 可 以 重复 利用 设计 好 的 测试 
用 例 , 具 有 很 好 的 可 扩展 性 ,大 幅度 缩短 代码 的 测试 时 间 。Python 标准 库 unittest 提供 
了 大 量 用 于 单元 测试 的 类 和 方法 ,其 中 最 常用 的 是 TestCase 类 ,其 常用 方法 如 表 11-1 
所 示 。 
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属 
表 11-1 TestCase 类 的 常用 方法 

方法 名 称 功能 说 明 方法 名 称 功能 说 明 
assertEqual(a,b) a 一 一 b assertNotEqual(a,b) al=b 
assertTrue( x) bool(x) is True assertFalse( x) bool(x) is False 
assertIs(ayb) aisb assertIsNot(a,b) aisnotb 
assertIsNone( x) xis None assertIsNotNone(x) xis not None 
assertIn(a,b) ainb assertNotIn(a,b) anotinb 
assertIsInstance(ayb) isinstance(a,b) assertNotlsInstance(a,b) not isinstance(ayb) 





assertAlmostEqual(a,b) 


round(a—b,7)==0 


assertNotAlmostEqual(a,b) 


round(a 一 b,7) !=0 














assertGreater(a,b) a>b assertGreaterEqual(a,b) a>=b 

assertLess(ayb) a<b assertLessEqual(a,b) a<=b 

assertRegex(s,r) r. search(s) assertNotRegex(s,r) not r, search(s) 

i 每 项 测试 开始 之 前 自动 调 ebony 每 项 测试 完成 之 后 自动 调 
用 该 函数 用 该 函数 














其 中 ,setUp() 和 tearDown() 这 两 个 方法 比较 特殊 ,分 别 在 每 个 测试 之 前 和 之 后 自动 
调用 ,常用 来 执行 数据 库 连 接 的 创建 与 关闭 ,文件 的 打开 与 关闭 等 操作 ,避免 编写 过 多 的 
重复 代码 。 

示例 11-1 编写 单元 测试 程序 。 

以 第 6 章 自 定义 栈 的 代码 为 例 ,演示 如 何 利 用 unittest 库 对 Stack 类 中 和 人 栈 .出 栈 \ 改 
变 大 小 以 及 满 / 空 测试 等 方法 进行 测试 .并 将 测试 结果 写 和 文件 test_Stack_result. txt。 


fram myStack import Stack 
# Python 单元 测试 标准 库 
jimport unittest 


class TestStack(unittest.TestCase) : 
Gef setUp (self) : 
# 测 试 之 前 以 追加 模式 打开 指定 文件 
Self.fpr open('D:\\test Stack result.txt', 'at ') 


def tearDown (self) : 
# 测 试 结束 后 关闭 文件 
self.fp.close() 


def test isprpty (self): 
try: 
Stack() 
# 确 保函 数 返回 结果 为 True 
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self.assertTrue (s.isErpty()) 
self. 印 .write('isEmpty passed\n') 
except Excepticn as e: 
self.fp.write ("isErpty failed\n') 


Gef test clear (self): 

try: 
Stack(5) 
for i in ['a','b','c']: 

s.push(i) 

# 测 试 清空 栈 操作 是 否 工作 正常 
3.clear() 
self.assertTrue (s.isEmpty()) 
self. 印 .write('clear passed\n') 

except Excepticn as e: 
self. 印 .write('clear failed\n') 


def test_isFull (self) : 
try: 
= Stack(3) 
3.Push () 
3.Push (2) 
3.Push (3) 
self.assertTrue (s.isFull() 
self. 印 .write('isFull passed\n') 
except Excepticn as e: 
self. 印 .write('isFull failed\n') 


Gef test_ Pushpop (self) : 

try: 
于 Stack() 
3.push(3) 
# 确 保 入 栈 后 立刻 出 栈 得 到 原来 的 元 素 
self.assertEqual (s.pop(),3) 
s-push('a') 
self.assertEqual (3.pop(), 'a') 
3elf.fp.write('push and pop passed\n') 

except Exception as e: 
self. 印 -write('push or pop failed\n') 


def test setSize(self): 
try: 
s Stack(8) 
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for i in range (8): 
3-push(i) 

self.assertTrue (5.isFull ()) 

# 测 试 扩大 栈 空间 是 否 正常 工作 

s.setSize(9) 

3.push(8) 

self.assertTrue (s.isFull ()) 

Self.assertEqual (3.pop() ,8) 

# 测 试 缩小 栈 空间 是 否 正常 工作 

3s.setSize (4) 

Self.assertEqual (3. size,9) 

self. 印 .write('setSize passed\n') 


在 Eclipse 十 PyDev 环境 中 ,Python 程序 有 Python Run 和 Python unittest 两 种 运行 
方式 ,前 者 只 运行 “过 _name 三 三 '，_main__':” 这 一 行 所 限定 的 代码 块 ,而 后 者 会 执行 
所 有 的 测试 代码 ,也 就 是 继承 自 unittest. TestCase 的 类 中 所 有 以 test 开头 的 方法 。 

在 进行 单元 测试 时 应 注意 : @ 测 试用 例 的 设计 应 该 是 完备 的 ,应 保证 获 盖 尽 可 能 多 
的 情况 ,尤其 是 要 覆盖 边界 条 件 , 对 目标 模块 的 功能 进行 充分 测试 ,避免 漏 测 ; @ 测 试用 
例 以 及 测试 代码 本 身 也 可 能 会 存在 bug, 通 过 测试 并 不 代表 目标 代码 没有 错误 ,但 是 一 般 
而 言 , 不 能 通过 测试 的 模块 代码 是 存在 问题 的 ; @ 再 好 的 测试 方法 和 测试 用 例 也 无 法 保 
证 能 够 发 现 所 有 错误 ,必须 通过 不 停 改 进 和 综合 多 种 测试 方法 并 且 精 心 设计 测试 用 例 来 
发 现 尽 可 能 多 的 潜在 问题 ; @ 除 了 功能 测试 ,还 应 对 程序 进行 性 能 测试 与 安全 性 测试 ,其 
至 还 需要 进行 规范 性 测试 以 保证 代码 可 读 性 和 可 维护 性 。 


本 章 小 结 


(1) 程序 出 错 是 一 件 非 常 难以 避免 的 事情 。 

(2) 异常 一 般 是 指 程序 运行 时 发 生 的 错误 。 

(3) 当 程 序 执行 过 程 中 出 现 错误 时 会 自动 引发 异常 ,程序 员 也 可 以 通过 raise 语句 显 
式 引 发 异常 。 

(4) 合理 使 用 异常 处 理 结构 可 以 使 得 程序 更 加 健壮 。 

(5) 异常 处 理 结构 可 以 带 有 else 子 句 , 当 try 块 中 的 代码 没有 出 现任 何 错误 时 执行 
else 块 中 的 代码 。 

(6) 在 异常 处 理 结构 中 ,finally 块 中 的 代码 总 是 会 得 到 执行 。 

(7) 软件 测试 对 于 保证 软件 质量 非常 重要 ,单元 测试 是 软件 测试 的 重要 技术 之 一 。 





3 
让 
有 和 
下 


第 11 章 ”代码 质量 保障 : 异常 处 理 结构 与 单元 测试 外 229 
四 


习 题 
Python 异常 处 理 结构 有 哪 几 种 形式 ? 
异常 和 错误 有 什么 区 别 ? 
Python 内 建 异 常 类 的 基 类 是 
断言 语句 的 语法 为 


Python 上 下 文 管理 语句 为 





ED 弘 
数据 库 应 用 开发 
so” 应 


毫 无 疑问 ,数据 库 技术 的 发 展 为 各 行 各 业 都 带 来 了 很 大 的 方便 ,数据 库 不 仅 支持 各 类 
数据 的 长 期 保存 ,更 重要 的 是 支持 各 种 跨 平台 、 跨 地 域 的 数据 查询 ,共享 以 及 修改 , 极 大 地 
方便 了 人 们 的 生活 和 工作 。 电 子 邮箱 、 金 融 行 业 、 聊 天 系统 、 各 类 网 站 、 办 公 自 动 化 系统 、 
各 种 管理 信息 系统 以 及 论坛 .社区 等 ,都 少不了 数据 库 技术 的 支持 。 另 外 , 近 些 年 来 大 数 
据 相关 技术 的 流行 在 一 定 程度 上 也 促使 了 NoSQL 数据 库 的 快速 发 展 。 本 书 主要 介绍 
SQLite、Access、MySQL、MS SQL Server 等 几 种 关系 型 数据 库 的 Python 接口 ,并 通过 几 
个 示例 来 演示 数据 的 增 、 删 、 改 、 查 等 操作 。 最 后 以 MongoDB 为 例 介 绍 Python 对 
NoSQL 数据 库 的 访问 和 操作 。 


12.1 使 用 Python 操作 SQLite 数据 库 


SQLite 是 内 髓 在 Python 中 的 轻 量 级 .基于 磁盘 文件 的 数据 库 管 理 系统 ,不 需要 安装 
和 配置 服务 器 ,支持 使 用 SQL 语句 来 访问 数据 库 。 该 数据 库 使 用 C 语言 开发 ,支持 大 多 
数 SQL91 标准 ,支持 原子 的 .一 致 的 ,独立 的 和 持久 的 事务 ,不 支持 外 键 限制 ;通过 数据 库 
级 的 独占 性 和 共享 锁定 来 实现 独立 事务 , 当 多 个 线程 同时 访问 同一 个 数据 库 并 试图 写 入 
数据 时 ,每 一 时 刻 只 有 一 个 线程 可 以 写 入 数据 。 

SQLite 支持 最 大 140TB 大 小 的 单个 数据 库 , 每 个 数据 库 完全 存储 在 单个 磁盘 文件 
中 ,以 B+ 树 数据 结构 的 形式 存储 ,一 个 数据 库 就 是 一 个 文件 ,通过 直接 复制 数据 库 文件 就 可 
以 实现 数据 库 的 备份 。 如 果 需 要 使 用 可 视 化 管理 工具 ,可 以 下 载 并 使 用 SQLiteManager、 
SQLite Database Browser 或 其 他 类 似 工具 。 

访问 和 操作 SQLite 数据 时 ,需要 首先 导入 sqlite3 模块 ,然后 创建 一 个 与 数据 库 关联 
的 Connection 对 象 ,例如 : 

import sqlite3 # 导 人 模块 

conrr sqlite3.connect ('exanple.db') # 连 接 数 据 库 

成 功 创建 Connection 对 象 以 后 ,再 创建 一 个 Cursor 对 象 ,并 且 调 用 Cursor 对 象 的 
execute() 方 法 来 执行 SQL 语句 创建 数据 表 以 及 查询 、 插 入 、 修 改 或 删除 数据 库 中 的 数 
据 , 例 如 : 
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ccomn.cursor() 

# 创建 表 

c.execute ('''CREATE, TABIE stocks (date text，trans text, synbol text, qty real，Price real) 7) 
# 插 和 人 一 条 记录 

c.execute ("INSERT INTO stocks VALUES ("2016- 01- 05"， "BUY', 'RHAT"', 100, 35.14)") 

# 提交 当 前 事务 ,保存 数据 

conn.cormit() 

# 关 闭 数据 库 连 接 


comn.close () 


如 果 需 要 查询 表 中 内 容 , 那 么 重新 创建 Connection 对 象 和 Cursor 对 象 之 后 ,可 以 使 
用 下 面 的 代码 来 查询 。 


for row in c.execute('SEIECT * ERCM stocks CRDER BY price'): 
Print (row) 


接 下 来 重点 介绍 sqlite3 模块 中 的 Connection、Cursor、Row 等 对 象 。 
1211 Comection 对 象 





Connection 是 sqlite3 模块 中 最 基本 也 是 最 重要 的 一 个 类 ,其 主要 方法 如 表 12-1 
所 示 。 
表 12-1 Connection 对 象 的 主要 方法 


























方 法 说 明 

execute(sql[ ，parameters]) 执行 一 条 SQL 语句 

executemany(sql[，parameters]) 执行 多 条 SQL 语句 

cursor() 返回 连接 的 游标 
提交 当前 事务 ,如果 不 提交 ,那么 自 上 次 调用 

commit() commit() 方 法 之 后 的 所 有 修改 都 不 会 真正 保存 到 
数据 库 中 

本 撤销 当前 事务 ,将 数据 库 恢 复 至 上 次 调用 commit() 
方法 后 的 状态 

close() 关闭 数据 库 连接 
创建 可 在 SQL 语句 中 调用 的 函数 ,其 中 name 为 函 

create_function(name，num_params，func) 数 名 ,num_params 表示 该 函数 可 以 接收 的 参数 个 
数 ,func 表示 Python 可 调用 对 象 





Connection 对 象 的 其 他 几 个 函数 都 比较 容易 理解 ,下 面 的 代码 演示 了 如 何在 sqlite3 
连接 中 创建 并 调用 自 定义 函数 : 

import sqlite3 

import hashlib 
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# 自 定义 函数 
aef md5sum(t) : 
return hashlib.md5 (t) .hexdigest () 


# 在 内 存 中 创建 临时 数据 库 

conr= sqlite3.connect (":memory:") 

# 创建 可 在 seL 语 句 中 调用 的 函数 

conn.create function ("md5", 1, md5sum) 

cur= conn.cursor() 

# 在 SQL 语句 中 调用 自 定义 函数 

cur.execute("SETECT md5(?)"，[" 中 国 山东 烟台 ".encode()]) 
Print (cur. fetchone () [0]) 


1212 Qursor 对 象 


游标 Cursor 也 是 sqlite3 模块 中 比较 重要 的 一 个 类 ,下 面 简 单 介 绍 Cursor 对 象 的 常 
用 方法 。 


1. execute(sqlL ，parameters]) 


该 方法 用 于 执行 一 条 SQL 语句 ,下 面 的 代码 演示 了 用 法 ,以 及 为 SQL 语句 传递 参数 
的 两 种 方法 ,分 别 使 用 问号 和 命名 变量 作为 占 位 符 。 


import sqlite3 


Conre sqlite3.connect (":memory:") 

Cur= conn.cursor() 

Cur.execute ("CREATE TABIE pecple (name last, age)") 

who= "Dong" 

age= 38 

# 使 用 问号 作为 占 位 符 

cur.execute ("INSERT INTO People VALUES (?, ?)", (who, age)) 

# 使 用 命名 变量 作为 占 位 符 

Cur.execute ("SEIRCT * FROM pecple WHERE name last= :who RND age= :age", 
{"who": who, "age": age}) 

Print (cur. fetchone ()) 


运行 结果 如 图 12-1 所 示 。 


===—=======-=========== RESTART: C:\Python 3.5\- 
(Dong' , 38) 


图 12-1 运行 结果 (一 ) 
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2. executemany(sql. seq_of_parameters) 


该 方法 用 来 对 于 所 有 给 定 参数 执行 同一 个 SQL 语句 ,参数 序列 可 以 使 用 不 同 的 方式 
产生 。 例 如 ,下 面 的 代码 使 用 迭代 来 产生 参数 序列 : 


import sqlite3 


# 自 定义 迭代 器 , 按 顺 序 生成 小 写字 母 
class IterChars: 
def init (self): 
self.count= ord('a') 
def iter _ (self): 
Teturn self 
Gef__next _(self): 
if self.count> ord('z"'): 
raise StopIteration 
self.count +=1 
retum (chr (self.count- 1),) 


conn= sqlite3.connect (":memory:") 

Cur= conn.cursor() 

Cur.execute ("CREATE TABIE characters (c)") 

# 创 建 迭代 器 对 象 

theIter= IterChars () 

# 插 入 记录 ,每 次 插入 一 个 英文 小 写字 母 

Cur.executemany ("INSERT INIO characters (c)VALUES (?)", theIter) 
# 读 取 并 显示 所 有 记录 

Cur .execute ("SELECT c FRCM characters") 

Print (cur.fetchall ()) 


下 面 的 代码 使 用 了 更 为 简洁 的 生成 器 来 产生 参数 : 
import sqlite3 
import string 


# 包 含 yield 语 句 的 函数 可 以 用 来 创建 生成 器 对 象 
Gef char generator(): 
for c in string.ascii lowercase: 


yield(c,) 


connr sqlite3.connect (":memory:") 
cur= conn.cursor() 

cur.execute ("CREATE TREIE characters (c)") 
# 使 用 生成 器 对 象 得 到 参数 序列 


Cur.executemany ("INSERT INIO characters (c)VALUES (?)", char generator()) 
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Cur .execute ("SETECT c FRCM characters") 
print (cur.fetchall ()) 


下 面 的 代码 使 用 直接 创建 的 序列 作为 SQL 语句 的 参数 : 
import sqlite3 


Perscns=[ 

("Hugo", "Boss"), 

(calvin "Klein") 

] 
conn= sqlite3.connect (":memory:") 
# 创 建 表 
conn.execute ("CREATE TABLE person (firstname, lastname)") 
# 插 人 数据 
Comn.executemany(TINSERT INTID Perscn (Firstnere, lastnene)\AILES (?, ?)", Perscns) 
# 显 示 数 据 
for row in conn.execute ("SETPCT firstname, lastname FROM person"): 

Print (row) 

Print ("I just deleted", oonmn.execute ("TEIETE FROM person") .rowoount, "rows") 


运行 结果 如 图 12-2 所 示 。 






(‘Hugo!, 'Boss') 
('Calvin! , 'Klein') 
I just deleted 2 rows 


图 12-2 运行 结果 (二 ) 


3. fetchone() fetchmany(size= cursor. arraysize) ,fetchall() 
这 3 个 方法 用 来 读 取 数据 。 假 设 数 据 库 通过 下 面 的 代码 创建 并 插入 数据 : 
import sqlite3 


connr sqlite3.connect ("D: /addressBook.db") 

Cur= conn.cursor () # 创 建 游标 

cur.execute('''INSERT INTO addressList (name , sex , Fhon , 90 , addiress)VALUES 

(王小丫 ， ' 妇 ' ， "13888997011' ， "66735' ， 北京 市 ')''') 
aur.execute('JNSERT INID adHressList (name, sex, Fhon, 0, actiress) VAILES (" 李 莉 '，' 女 '，'15808066055',' 
675797', ' 天 津 市 ")'"') 

ar.execute(''TNSERT JNIO adHiressList (name, sex, Hhon, OQ, actiress) WAILES (' 李 星 草 '，' 男 '，'15912108090',' 
3232099'， 昆明 市 )'"') 

conn.cammit () # 提 交 事务 ,把 数据 写 和 数据库 


conn.close() 


下 面 的 代码 演示 了 使 用 fetchall() 读 取 数 据 的 方法 : 
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jimport sqlite3 


conn= sqlite3.connect ('D:/addressBook.db') 
Cur= conn.cursor() 
Cur.execute('SEIECT * FROM addressList') 
li= aur.fetchall () # 返 回 所 有 查询 结果 
for line in 1i: 
for item in line: 
print (item, end=' ') 


print() 
conn.close() 
1213 Row 对 象 


假设 数据 以 下 面 的 方式 创建 并 插入 数据 : 


conn= sqlite3.connect ("D:\\test .dob") 

c= conmn.cursor() 

C.execute(' ' ' CRERATE TABLE stocks (date text, trans text, symbol text, qty real, price 
real)''') 

c.execute( """ INSERT INTO stocks VALUES('2016- 01- 05','BUY', 'RHAT', 100, 35. 
et 

conn.oommit () 

c.close() 


那么 ,可 以 使 用 下 面 的 方式 来 读 取 其 中 数据 : 


conn.row factory= sqlite3.Row 
C= conn.cursor() 
Cc.execute('SEIECT * ERCM stocks') 
Cc.fetchone() 
Print (type (r)) 
Print (tuple(r)) 
Print (r[2]) 
Print (r.keys()) 
Print (r['qty"]) 
for field in r: 
Print (fielqd) 


12.2 使 用 Python 操作 其 他 关系 型 数据 库 


除了 使 用 标准 库 sqlite3 操作 SQLite 数据 库 以 外 ,Python 还 可 以 借助 于 功能 强大 的 
扩展 库 来 操作 Access、MS SQL Server、MySQL 等 多 种 类 型 的 数据 库 ,下面 简单 介绍 其 中 
时 个 % 
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1221 操作 Aocess 数据 库 


需要 首先 安装 Python for Windows extensions, 即 Pywin32。 然 后 可 以 参考 下 面 的 
步骤 和 方式 来 访问 Access 数据 库 。 


1. 建立 数据 库 连 接 


import win32ocm.client 

conr= win32com.client.Dispatch (r'ADODB.Connection') 

DEN= 'FROVIDER= Microsoft.Jet.OLETB.4.0;DRTR SOURCE= C: /MyTDB .mdb;' 
conn.Open (DSN) 


2. 打开 记录 集 


Is= win32com.client.Dispatch (r'ADODB.Recordset') 
rs_name= 'MyReoordset' # 表 名 
r3.0pen('['+rs namet ']', oonn, 1, 3) 


3. 操作 记录 和 集 


rs.RGaNew() 
rs.Fields. Ttem(]) .Value= 'data' 
rs.Update!() 


4. 操作 数据 


conm= win32ccm.client.Dispatch (r'ADODB.Connection') 

DSN= 'PROVITER= Microsoft.Jet.OLETB.4.0;DRTR SOURCE= C:/MYPB.mdb " 

sql_ statement= " INSERT INTO [Table Name] ([Field 1], [Field 2])VALUES('datal', 
'data2')" 

conn.OPen (DSN) 

conn.Execute (sql_statement) 

conn.Close () 


5. 遍历 记录 


r3.MoveFirst () 
count=0 
while True: 

if rs.EOF: 
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在 操作 Access 数据 库 时 ,如 果 一 个 记录 集 是 空 的 ,那么 将 指针 移 到 第 一 个 记录 将 导 
致 一 个 错误 ,因为 此 时 RecordCount 是 无 效 的 。 解 决 的 方法 是 : 打开 一 个 记录 集 之 前 , 先 


将 Cursorlocation 设置 为 3, 然 后 打开 记录 集 , 此 时 RecordCount 将 是 有 效 的 。 
r3.Cursorlocatior=3 
rs.Open('SETECT * FROM [Table Name]', conn) # 确 保 com 处 于 打开 状态 
IsS.Recordcount 


1222 操作 MS SQL Server 数据 库 


可 以 使 用 pywin32 .pymssql 和 pyodbc 等 多 种 不 同 的 方式 来 访问 MS SQL Server 数 
据 库 。 

先 来 了 解 一 下 pywin32 模块 访问 MS SQL Server 数据 库 的 步骤 ,如 果 下 面 的 代码 不 
能 正常 执行 ,很 可 能 还 需要 使 用 命令 pip install adodbapi 安装 adodbapi 扩展 库 。 


1. 添加 引用 

import adodbapi 

adodbapi .adodbapi .verbose— False #acds details to the sample printout 
import adodbapi .ado_consts as adc 


2. 创建 连接 


CEgF {'server' : '192.168.29.86\ \eclexpress', ‘password': "ooocv 'db': 'pecitemp'} 
constr= r"Provider= SQLOLETB.1; Initial Catalog= %s; Data Souroe= gs3; User ID= %s; Password= $5; "$® (Cfg 
["'db'], Cfg['server'], 'sa', Cfg['password']) 

conn= adodbapi .connect (constr) 


3. 执行 SQL 语句 

Cur= conn.cursor() 

sql= ''"SELECT * FROM softextBook WHERE title= '{0}"' AND remark3!="'{1}'"''"''. 
format (bookName, flag) 

Cur.execute(sql) 

data= cur. fetchall () 


cur.close() 


4. 执行 存储 过 程 


# 假 设 prcNeme 有 3 个 参数 ,最 后 一 个 参数 传 了 null 
ret= cur.callproc('procName' armml,Parmm2,None)) 


conncommit () 
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5. 关闭 连接 
conmn.close() 


接 下 来 再 通过 一 个 示例 来 简单 了 解 一 下 使 用 pymssql 模块 访问 MS SQL Server 数 
据 库 的 方法 。 如 果 下 面 的 代码 提示 无 法 导入 pymssql 模块 ,那么 可 以 登录 http://www. 
lfd. uci. edu/ 一 gohlke/pythonlibs 下 载 与 已 安装 Python 版 本 对 应 的 pymssql 的 whl 文 
件 , 然 后 使 用 pip 命令 进行 安装 。 


import pymssql 
conn= pymssq] .connect (host= 'SQL)1', user= ‘user', password= 'password', 
Gatabase= 'mydatabase') 
Cur= conmn.cursor() 
cur.execute ('CREATE TABIE persons (id INT, name VARCHAR(100))') 
Cur.executemany ("INSERT INIO persons VALUES (%d, xinos.King)", 
[(1, "John Doe'), (2, "Jane Doe')]) 

conn.commit() 
Cur.execute('SEIECT # FROM Persons WHERE salesrep= xinos.king', 'John Doe') 
Iow= cur.fetchone () 
while row: 

print ("ID= %d, Name= xinos.king" $ (row[0], row[1])) 

ITow= cur.fetchone() 
Cur.execute ("SEIECT # FROM persons WHERE salesrep LIKE 'J%"") 


conmn.close () 

最 后 看 看 如 何 使 用 pyodbc 扩展 库 读 取 MS SQL Server 2008 数据 库 中 的 信息 ,如 果 下 面 
的 代码 提示 无 法 导入 pyodbc, 请 登录 http://www. lfd. uci. edu/ 一 gohlke/pythonlibs 网 址 下 
载 相应 的 whl 文件 之 后 再 安装 。 


import pyodbc 


上 "DRIVER= {SQL Server};SERVER= .;DATABASE= Test;UID= sa;PWD= test." 
conm=Pyodbc.connect (s) 
cur= oonmn.cursor() 
Cur.execute ('SEIECT * FROM yonghubiao') 
IOw= cur.fetchone () 
while row: 
Print (row) 
ITow= cur.fetchone() 


comn.close () 


1223 操作 MSQL 数据 库 


Python 访问 MySQL 数据 库 可 以 使 用 MySQLDb 模块 ,该 模块 主要 方法 如 下 。 
(1) commit() : 提交 事务 。 
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(2) rollback(): 回 深 事 务 。 
(3) callproc(self, procname,， args): 用 于 执行 存储 过 程 ,接收 的 参数 为 存储 过 程 名 
和 参数 列表 ,返回 值 为 受 影响 的 行 数 。 
(4) execute(self，query，args) : 执行 单条 SQL 语句 ,接收 的 参数 为 SQL 语句 本 身 
和 使 用 的 参数 列表 ,返回 值 为 受 影响 的 行 数 。 
(5) executemany(self ,query, args): 执行 单条 SQL 语句 ,但 是 重复 执行 参数 列表 
里 的 参数 ,返回 值 为 受 影响 的 行 数 。 
(6) nextset(self) : 移 到 下 一 个 结果 集 。 
(7) fetchall(self) : 接收 全 部 的 返回 结果 行 。 
(8) fetchmany(self，size 王 None) : 接收 size 条 返回 结果 行 ,如 果 size 的 值 大 于 返回 
的 结果 行 的 数量 , 则 会 返回 cursor. arraysize 条 数据 。 
(9) fetchone(self) : 返回 一 条 结果 行 。 
(10) scroll(self，value，mode 王 "relative) : 移动 指针 到 某 一 行 ,如 果 mode 王 "relative'， 
则 表示 从 当前 所 在 行 移动 value 条 记录 ;如 果 mode 二 'absolute", 则 表示 从 结果 集 的 第 一 行 
移动 value 条 记录 。 
使 用 该 模块 查询 MySQL 数据 库 记 录 的 方法 如 下 面 的 代码 所 示 : 
import MySQLdb 
try: 
conn= MysoLdb.connect (host= 'localhost'',user= 'root',passwde ‘root', 
dkr= 'test',port= 3306) 
cur= conn.cursor() 
Cur.execute('SEIECT * ERCOM user') 
cur.close() 
com.close() 
except MySQLdb.Error as e: 
Print ("Mysql Error %d: %s" $(e.args[0], e.args[1])) 
插入 数据 的 用 法 如 下 面 的 代码 所 示 : 
import MySoLdb 
try: 
com SQLdb.oonnect (host= ,localhostvuser= 'root',passwd ‘root',port— 
3306) 
Cur= conn.cursor() 
Cur .execute ('CREATE DATAPASE IF NOT EXISTS python') 
conn.select db('python') 
Cur .execute ('CREATE TABIE test (id int, info varchar(20)) ') 
value= [1, "hi rollen'] 
Cur.execute ("INSFRT INIO test VALUES ($3,%s) value) 
values= [] 
for i in range (20) : 
values.append ((i, 'hi rollen'+ str(i))) 
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cur .executemany ("INSERT INIO test VALUES (%3,%3) ',values) 
Cur .execute ("UPDATE test SET info="T am rollen" WHERE id= 3') 
conn-commit() 
cur.close() 
conn.close() 

except MySQLdb.Error as e: 
Print ("MySQL Error %q: $s" $(e.args[0], e.args[1])) 


12.3 操作 MongoDB 数据 库 


一 项 权威 调查 显示 ,在 大 数据 时 代 软 件 开 发 人 员 必 备 的 十 项 技能 中 , MongoDB 数据 
库 名 列 第 二 , 仅 次 于 HTML5。MongoDB 是 一 个 基于 分 布 式 文件 存储 的 文档 数据 库 , 可 
以 说 是 非 关系 型 (Not Only SQL,NoSQL) 数 据 库 中 比较 像 关系 型 数据 库 的 一 个 ,具有 免 
费 .操作 简单 .面向 文档 存储 自动 分 片 .可 扩展 性 强 .查询 功能 强大 等 特点 ,对 大 数据 处 理 
支持 较 好 , 旨 在 为 Web 应 用 提供 可 扩展 的 高 性 能 数据 存储 解决 方案 。MongoDB 将 数据 
存储 为 一 个 文档 ,数据 结构 由 键 值 (key 一 value) 对 组 成 。MongoDB 文档 类 似 于 JSON 对 
象 。 字 段 值 可 以 包含 其 他 文档 ,数组 及 文档 数组 。 

MongoDB 数据 库 可 以 到 官方 网 站 https://www. mongodb. org/downloads 下 载 , 安 
装 之 后 打开 命令 提示 符 环境 并 切换 到 MongoDB 安装 目录 中 的 server\3. 2\bin 文件 夹 ， 
然后 执行 命令 mongod 一 dbpath D: \ data 一 journal 一 storageEngine 二 mmapvl 启动 
MongoDB, 当然 需要 首先 在 D 盘 新 建文 件 夹 data, 让 刚才 那个 命令 提示 符 环境 始终 处 于 
运行 状态 ,然后 打开 一 个 命令 提示 符 环境 ,执行 mongo 命令 连接 MongoDB 数据 库 , 如 果 
连接 成 功 ,会 显示 一 个 “二 "符号 作为 提示 符 , 之 后 就 可 以 输入 MongoDB 命令 了 。 例 如 ， 
下 面 的 命令 可 以 打开 或 创建 数据 库 students: 


> use students 

下 面 的 命令 用 来 在 数据 库 中 插入 数据 : 

> zhangsan= { "name': 'Zhangsan', 'age':18, 'sex':"'male'} 

> db.students.insert (zhangsan) 

> lisi= {'name':'Lisi', ‘age':19, 'sex':'male'} 

> db.students.insert (lisi) 

下 面 的 命令 用 来 查询 数据 库 中 的 记录 : 

> db.students.find() 

下 面 的 命令 用 来 查看 系统 中 的 所 有 数据 库 名 称 : 

> show dbs 

其 他 更 多 MongoDB 命令 请 读者 查阅 相关 资料 。 另 外 ,Python 扩展 库 pymongo 完美 
支持 MongoDB 数据 的 操作 ,可 以 使 用 pip 命令 进行 安装 。 下 面 的 代码 演示 了 pymongo 
操作 MongoDB 数据 库 的 一 部 分 用 法 ,算是 抛砖引玉 ,更 多 的 用 法 可 以 使 用 学 习 Python 
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的 利器 dirC) 和 help() 来 获得 ,或 者 查阅 MongoDB 官方 文档 。 


> > > import pymongo # 导 人 模块 
>>> client= pymongo.MongoClient ("localhost' 27017) 
# 连 接 数据 库 ,27017 是 默认 端口 

>>>dbr client.students # 获 取 数 据 库 
>>> db.collection names() # 查 看 数据 集合 名 称 列表 
['students', 'system.indexes'] 
>>> students= db.students # 获 取 数 据 集合 
>>> students.find() 
< pymongo. cursor.Cursor cbject at 0x00000000030934RB> 
>>> for item in students.find() : # 遍 历数 据 

Print (item) 
{'age': 18.0, 'sex': male', '_id': GbjectId("5722cbcfeadfb2gab4a52e237)， 
"ame': 'Zhangsan'} 
{'age': 19.0, 'sex': rale', '_id': GbjectId("5722cc6eeadfb295b4a52e24")， 


"ame' : 'Lisi'} 
>>>wangwu= {'name' : 'Wangwu', 'age':20, 'sex':'male'} 


> > > students.insert (wangwu) # 插 人 一 条 记录 
CbjectId('5723137346bf3d1804b5f4cc') 
> >> for item in students.find({"name':"Wangwa']): # 指 定 查询 条 件 
print (item) 
{'age': 20, '_id': ObjectId('5723137346bf3d1804b5f4cc'), 'sex': 'male', ' 
name' : Wangwu'} 
>>> students.find one() # 获 取 一 条 记录 
{'age': 18.0, 'sex': 'male', '_id': objectId('5722cbcfeadfb295b4a52e23')，， 


name' : 'Zhangsan'} 
> >> students.find one({'name': "Wangwu']}) 
{"'age': 20, '_id': ObjectId('5723137346bf3d1804b5f4cc'), 'sex': 'male', ' 


name' : Wangwu'} 

>>> students.find() .count () # 记 录 总 数 

3 

> > > students.rempve (fname': "Wangwu']) # 删 除 一 条 记录 


frok': 1, n': 1} 
>>> for item in students.find() : 
print (item) 
{'name': 'Zhangsan', '_ id': ObjectId('5722cbcfeadfb295b4a52e23'), ' sex': 
'male', 'age': 18.0} 
{'name': 'Lisi', '_id': ObjectId('5722cc6eeadfp295b4a52e24'), 'sex': 'male', 
"age' : 19.0} 
>>> students.find() .count() 
上 
> > > students.create index([ ("name', pymongo.ASCENDING) ]) # 创 建 索引 


‘name 1" 
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> >> students .update ({ ‘name': "Zhangsan'}, {'$ set':{'age':25}}) # 更 新 数据 库 
fnMpdified': 1, 'ok': 1, "updatedFxisting': True, 'n': 1} 


> >> students.update ({'age' :25}, {"$ set':{'sex': ‘Female'}}) # 更 新 数据 库 
{'mMpdified': 1, ‘ok': 1, "updatedEyisting': True, n': 1} 
>>> students.remove() # 清 空 数据 库 


ews 1 "my 

>>> students.find() .count() 

0 

>>>Zhangsan= {"'name':'Zhangsan', ‘age':20, 'sex':'Male'} 
>>>Lisi= {"'name':'Lisi', 'age':21, 'sex':'Male'} 
>>>TWEngwu= {'name' : 'Wangwu', 'age':22, 'sex':'Female'} 


> > > students.insert many ([Zhangsan, Lisi, Wangwu]) # 插 入 多 条 数据 

< pymongo.result's. InsertManyResult. cbject at 0x0000000003762750> 

>>> for item in stucents.find() .sort (neme' ,Pyrongp.ASCENDING) : # 对 查询 结果 排序 
Print (item) 

{'name': 'Lisi', '_id': ObjectIid('57240d3f46bf3dll8ce5bbe4'), 'sex': 'Male', 

"age': 21} 

{'name': 'Wangwu', '_ id': ObjectId (' 57240d3f46bf3dll8ce5bbe5'), ' sex': 

'Female', 'age': 22} 

{'name': 'Zhangsan', '_ id': ObjectId("'57240d3f46bf3dll8ce5bbe3'), ' sex': 


'Male', 'age': 20} 
> > > for item in students. find() .sort([('sex',pymongo. DESCENDING), 
('name' , pymongo. RSCENDING) ] ) : 
print ( item) 


{ name' : 'Lisi', '_id': ObjectId('57240d3f46bf3dl18ce5bbe4 ')，'sex': 'Male', 


"age': 21} 

{'name': 'Zhangsan', '_ id': ObjectId('57240d3f46bf3dl118ce5bbe3 ')， "sex': 
'Male', 'age': 20} 

{'name': 'Wangwu', '_ id': ObjectId (' 57240d3f46bf3dll8ce5bbe5'), ' sex': 


'Female', 'age': 22} 
12.4 精彩 案例 赏析 


示例 12-1 批量 Excel 文件 中 的 数据 快速 导入 SQLite 数据 库 。 

下 面 的 第 一 个 函数 generateRandomData() 用 来 生成 50 个 Excel 2007+ 文件 ,文件 名 
分 别 为 0. xlsx、1. xlsx、2. xlsx、… 、48. xlsx、49. xlsx, 每 个 文件 中 有 若干 行 ( 小 于 10 000 的 
随机 数 ) 信 息 , 每 行 有 5 列 , 每 列 有 30 个 随机 字符 。 第 二 个 函数 eachXlsx() 用 来 读 取 并 返 
回 每 个 Excel 文件 所 有 数据 的 生成 器 函数 。 第 三 个 函数 xlsx2sqlite() 用 来 把 所 有 Excel 
文件 中 的 数据 导入 SQLite 数据 库 , 其 中 在 executemany() 函 数 中 用 到 了 第 二 个 函数 。 另 
外 ,本 例 代码 要 求 先 使 用 SQLite Database Browser 或 类 似 工具 创建 SQLite 数据 库 文件 
data. db, 其 中 有 个 名 为 fromxlsx 的 数据 表 , 并 有 a、b、c、d、e 这 5 个 字段 。 


fram random inport choice，randrange 
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fram string import digits, ascii letters 
fram os import listdir, mkdir 

fram os.path import isdir 

import sqlite3 

fram apenpyxl import Workbook, load workbock 


def generateRandcmData () : 
必 生成 测试 数据 , 共 50 个 Excel 文件 ,每 个 文件 有 5 列 随机 字符 串 """ 
# 如 果 不 存 在 子 文件 夹 芭 sxs, 就 创建 
if not isdir('xlsxs"): 
mkdir ('xlsxs') 


# total 表示 记录 总 条 数 
gcbal total 


# 候 选 字符 集 
characters =digits +ascii letters 


# 生 成 50 个 Excel 文件 
for i in range (50) : 
XLSsName = 'xlsxs\" + str (i) + '.xlsx' 


# 随 机 数 ,每 个 xlsx 文 件 的 行 数 不 一 样 
totalLines = randrange (10**4) 


# 创 建 Workbook, 获 取 第 1 个 Worksheet 
wh =Workbook () 
ws =wh.worksheets[0] 


# 写 人 表 头 
ws.append(['a', 'b', 'c', 'd', 'e']) 
# 随 机 数据 ,每 行 5 个 字段 ,每 个 字段 3 个 字符 
for j in range (totalLines) : 
line = [''.join( (choice (characters) for ii in range (30))) for jj in 
range(5)] 
ws.append (line) 
total +=1 


# 保 存 并 sx 文件 
wh.save (xlsName) 


def eachXlsx (xlsxFp) : 
""' 针 对 每 个 双 sx 文 件 的 生成 器 '" 
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# 打 开 Excel 文件 ,获取 第 1 个 wbrksheet 
Wh = load workbook (x1sxEn) 
ws =wb.worksheets [0] 
for index, row in enumerate (ws.rows) : 

# 忽 略 表 头 

if index ==0: 

Continue 
Yield tuple (rep (larbda x:x.value, row)) 


def x1sx2sqlite(): 
"从 批量 Excel 文件 中 导 人 数据 到 sorite 数 据 库 '"" 
# 获 取 所 有 xJsx 文 件 名 
21sx3 = ('xlsxs\'+ fn for fn in listdir ('xlsxs')) 


# 连 接 数据 库 ,创建 游标 
with sqlite3.connect ('dataxlsx.db') as oomn: 
cur =conn.cursor() 
for xlsx in xlsxs: 
# 批 量 导 和 人 ,减少 提交 事务 的 次 数 ,可 以 提高 速度 
sql = 'INSERT INTO framlsx VALUES (2?, 2 3223) 7 
Cur.executemany (sql，eachXlsx (xlsx)) 


conn.cormit () 


# 用 来 记录 生成 的 随机 数据 的 总 行 数 
total =0 


# 生 成 随机 数据 
generateRandcmData () 


# 导 和 人 数据 ,并 测试 速度 
start =time() 
xlsx2sqlite() 

delta =time()- start 


Print(" 导 入 用时: ', delta) 
Print(" 导 人 速度 (条 / 秒 ): ', total/delta) 


本 章 小 结 


(1) SQLite 数据 库 不 需要 安装 和 配置 服务 器 软件 ,也 不 开放 特定 的 端口 ,每 个 数据 
库 完全 存储 在 单个 磁盘 文件 中 。 

(2) SQLiteManager 和 SQLite Database Browser 是 两 个 不 错 的 SQLite 数据 库 可 视 
化 管理 工具 。 
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(3) Python 标准 库 sqlite3 支持 对 SQLite 数据 库 的 操作 。 
(4) Python 也 可 以 操作 Access、MS SQL Server、MySQL、Oracle 等 数据 库 ,但 是 需 
要 安装 相应 的 扩展 库 。 


习 题 


12.1 简单 介绍 SQLite 数据 库 。 

12.2 使 用 Python 内置 函数 dir() 查 看 Cursor 对 象 中 的 方法 ,并 使 用 内 置 函 数 help() 
查看 其 用 法 。 

12.3 叙述 使 用 Python 操作 Access 数据 库 的 步骤 。 

12.4 和 叙述 使 用 Python 操作 MS SQL Server 数据 库 的 步骤 。 

12.5 叙述 使 用 Python 操作 MySQL 数据 库 的 步骤 。 


第 13 9 
怕 数据 分 析 与 科学 计算 可 视 化 
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用 于 数据 分 析 与 科学 计算 可 视 化 的 Python 模块 非常 多 ,如 numpy、scipy、pandas、 
statistics .matplotlib .sympy ,traits,traitsUI.Chaco .TVTK Mayavi、 VPython, OpenCV, 
其 中 ,numpy 模块 是 科学 计算 包 , 提 供 了 Python 中 没有 的 数组 对 象 ,支持 N 维 数组 运算 、 
处 理 大 型 和 矩阵、 成 熟 的 广播 函数 库 、 矢 量 运算 、 线 性 代数 、 傅 里 叶 变 换 以 及 随机 数 生成 等 功 
能 ,可 与 C++ ,FORTRAN 等 语言 无 颖 结合 , 树 莓 派 Python v3 默认 安装 就 已 包含 了 
numpy。scipy 模块 依赖 于 numpy, 提 供 了 更 多 的 数学 工具 ,包括 矩阵 运算 、 线 性 方程 组 求 
解 、 积 分 .优化 等 。matplotlib 是 比较 常用 的 绘图 模块 ,可 以 快速 地 将 各 种 计算 结果 以 各 
种 图 形 形 式 展示 出 来 。 大 部 分 扩展 库 都 可 以 使 用 pip 命令 直接 安装 ,如 果 有 不 能 安装 或 
者 安装 之 后 无 法 正常 工作 的 扩展 库 , 可 以 登录 下 面 的 网 页 选择 合适 的 版 本 下 载 和 安装 : 


http://www.lfd.uci.edu/~ gohlke/pythonlibs/ 


13.1 扩展 库 numpy 简介 


根据 Python 社区 的 习惯 ,首先 使 用 下 面 的 方式 来 导入 numpy 模块 : 


> >> import numpy as np 

1. 生成 数组 

>>>mp.array(d, 2, 3, 4 5)) # 把 Python 列表 转换 成 数组 
array([l, 2, 3, 4, 5]) 

>>> np.array (range (5)) # 把 Python 的 range 对 象 转换 成 数组 


array([0, 1, 2, 3, 4]) 
>>>mnp.array([[1, 2, 3], [4, 5, 6]]) 
array([[l, 2, 3], 

[4, 5, 6]) 
>>>nmp.linspace (0, 10, 11) # 生 成 等 差 数 组 
i 
>>>mp.linspace(0, 1, 11) 
array([0. ， 0.1l, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9， 1. ]) 
>>> np.logspace (0, 100, 10) # 对 数 数组 
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array([ 1.00000000et 000, 1.29154967et 011, 1.66810054et 022, 
2.15443469e+ 033,， 2.78255940e+ 044，。 3.59381366e+ 055, 
4.64158883e+ 066, 5.99484250et 077， 7.74263683e+ 088, 
1.00000000e+ 100]) 

>>>mp.zeros((3,3)) # 全 0 二 维 数组 

166 “02 04 

[0. 0. 0.] 

[0. 0. 0.]] 

>>>mp.zeros((3,1)) # 全 0 一 维 数组 

array([[ 0.]， 

[0.], 

[0.]]) 

>>>mnp.zeros((1,3)) 

array([[ 0., 0., 0.]]) 

>>>np.anes((3,3)) # 全 1 二 维 数组 

array([[1.， 1.， 1.], 

tly Bl 

Er "hy lf 

>>>np.cnes((1,3)) # 全 1 一 维 数组 

array([[1.， 1.， 1.]]) 

>>>mp.identity(3) # 单 位 矩阵 

array([[1., 0.， 0.], 

Lo Sy Gl 

to Oe Ll 

>>>mnp.identity(2) 

array([[ 1., 0.]， 

fo lh 

>>>mp.empty((3,3)) # 空 数组 ,只 申请 空间 而 不 初始 化 ,元 素 值 是 不 确定 的 

array([[ 0.， 0.， 0.]， 

Fo， ,Ol 
站 





2. 数组 与 数值 的 算术 运算 


>>> 闻 mp.array(( 2, 3, 4, 5)) # 创 建 数组 对 象 
>>>x 


array([l, 2, 3, 4, 5]) 


>>>x* 2 # 数 组 与 数值 相 乘 , 所 有 元 素 与 数值 相 乘 
array([ 2, 4, 6, 8, 10]) 

ES # 数 组 与 数值 相 除 

array([ 0.5, 1. , 1.5, 2. ，2.5]) 

eb # 数 组 与 数值 整除 


array([0, 1, 1, 2, 2], dtype= int32) 
>>>x#*%* 3 # 知 运算 
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array ([1, 8, 27, 64, 125], dtype= int32) 


>>>xt2 # 数 组 与 数值 相 加 
array([3 4 5 6 7]) 
>>>x $3 # 余 数 


array([l, 2, 0, 1, 2], dtype= int32) 


3. 数组 与 数组 的 算术 运算 


>>>aemp.array((l, 2, 3)) 
>>>b=np.array(([l, 2, 3], [4, 5, 6], [7, 8, 9])) 


>>>cra* b # 数 组 与 数组 相 乘 
>>>c #a 中 的 每 个 元 素 乘 以 b 中 的 每 一 列 元 素 
array([[ 1, 4, 9], 

[4, 10, 18], 

[7, 16, 27]]) 
>>>c/b # 数 组 之 间 的 除法 运算 
rvay(ll ly 2 3] 

[ly 2 Bls 

El Zs DD 
>>>c/a 
array([[ 1., 2., 3.], 

Las 5 Gl 

Es. yD 
>>>ata # 数 组 之 间 的 加 法 运算 
array ([2, 4, 6]) 
>>>a* a # 数 组 之 间 的 乘法 运算 
array([l, 4, 9]) 
>>>a-a # 数 组 之 间 的 减法 运算 
array ([0, 0, 0]) 
>>>a/a # 数 组 之 间 的 除法 运算 
array([1.， 1.， 1.]) 





4. 二 维 数组 转 置 


>>>b=np.array(([l, 2, 3], [4, 5 6], [7, 8, 9])) 
> 
array([[ 2, 3], 

[4, 5, go], 

[7, 8, 9]) 
>>>b.T # 转 置 
array([[l, 4 7], 

[2, 5, 8], 

[3, 6 9]) 
>>>ae rmp.array((l, 2, 3, 4)) 





>>>a 

array([l, 2, 3, 4]) 
>>>a.T 
array([l, 2, 3, 4]) 


5. 向 量 内 积 


>>>aemp.array((5, 6, 7)) 
>>>b=rnp.array((6, 6, 日) 
>>>a.dot (b) 

108 

>>>np.dot(arb) 

108 
>>>cm.aray(([l,2,3], [4,5,6], [7,8,9])) 
>>>cEc.T 

>>>c.dot (a) 

array([ 38, 2, 146]) 
>>>c[0] .dot (a) 

38 

>>>c[] .dot (a) 

92 

>>>c[2] .dot (a) 

146 

>>>a.dot(c) 

array([ 78, 9%, 114]) 
>>>a.dot (cT[0]) 

78 

>>>a.dot (cT[1]) 

96 

>>>a.dot(cr[2]) 

114 


6. 数组 元 素 访问 


>>>b=np.array(([1,2,3], [4,5,6], [7,8,9])) 


>>>b 

array([[l, 2, 3], 
[4 5, 9， 
[7, 8, 9]) 

>>>b[0] 

array([l, 2, 3]) 

>>>b[0] [0] 

和 
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# 一 维 数组 转 置 以 后 和 原来 是 一 样 的 


# 向 量 内 积 


# 二 维 数组 
# 转 置 
# 二 维 数组 的 每 行 与 一 维 向 量 计算 内 积 


# 两 个 一 维 向 量 计算 内 积 


# 一 维 向 量 与 二 维 向 量 的 每 列 计算 内 积 


# 第 0 行 


# 第 0 行 第 0 列 的 元 素 值 


数组 元 素 还 支持 多 元 素 同时 访问 ,例如 : 
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>>> 革 mp.arange (0, 100, 10, dtype= np.floating) # 创 建 等 差 数 组 
>>>x 
array([0., 10., 20., 30., 40., 50., 60., 70., 80.，90.]) 
> >> index= mp.random.randint (0, len(x), 5) # 生 成 5 个 随机 整数 作为 下 标 
>>> index 
array([5, 4, 1, 2, 9]) 
>>>x[index] # 同 时 访问 多 个 元 素 的 值 
array([50.，40.，10.，20.，90.]) 
>>>x[index]= [1, 2, 3, 4, 5] # 同 时 修改 多 个 下 标 指定 的 元 素 值 
>>>x 
array([0., 3., 4., 30., 2., 1., 60., 70., 80., 5.]) 
>>>x[[1,2,3]] # 同 时 访问 多 个 元 素 的 值 


array([3., 4., 30.]) 


7. 对 数组 进行 函数 运算 


>>> 辣 mp.arange(0，100，10，dtype= rp.floating) 
>>>np.sin(x) # 一 维 数组 中 所 有 元 素 求 正弦 值 
array([ 0. + —0.54402111, 0.91294525, — 0.98803162, 0.74511316, 
— 0.26237485, — 0.30481062, 0.77389068，-- 0.99388865， 0.89399666]) 

>>>b=rnp.array(([l, 2, 3], [4, 5, 6], [7, 8, 9])) 
>>>np.cos (to) # 二 维 数组 中 所 有 元 素 求 余弦 值 
array([[ 0.54030231, — 0.41614684, — 0.9899925 ], 

[- 0.65364362, 0.28366219, 0.96017029], 

[ 0.75390225, — 0.14550003, — 0.91113026]]) 
>>>nmp.round( ) # 四 舍 五 人 
array([[ 1., -0., -1.], 

[1-.， 0.， 1.], 

[1.,—0., -1.]]) 
>>> 闻 mp.random.rand(10) # 包 含 10 个 随机 数 的 数组 
>>>3X# 10 
>>>x 
array([6.03635335， 3.90542305, 0.05402166, 0.97778005, 8.86122047, 

8.68849771， 8.43456386, 6.10805351, 1.01185534, 5.52150462]) 


>>>nmp.floor (x) # 所 有 元 素 向 下 取 整 
array([6., 3., 0., 0., 8., 8., 8., 6., 1., 5.]) 
>>>mnp.ceil (x) # 所 有 元 素 向 上 取 整 


array([7., 4., 1., 1., 9., 9., 9., 7., 2., 6.]) 


8. 对 和 矩阵 不 同 维度 上 的 元 素 进 行 计算 


>>>x mp.arange (0,10) .reshape (2,5) # 创 建 二 维 数组 


>>>% 


array([[0, 1, 2, 3, 4], 





[67 8, 9]) 
>>>mp-sm 人 ze) 
45 
>>>np.amkx axis= 0) 
array([5, 7, 9, 11, 13]) 
>>>mp.sum(x axis=1) 
array([10，35]) 
>>>mp-mean (xy axis= 0) 
array([ 2.5, 3.5, 4.5, 5.5, 6.5]) 
>>>weight= [0.3, 0.7] 
>>> np.average (x, axis= 0, weights=weight) 
array([ 3.5, 4.5, 5.5, 6€.5, 7.5]) 
>>>rnp.max(x) 
9 
>>>rnp.mx(x, axis=0) 
array([5, 6, 7, 8, 9]) 
>>>= mp.random.randint (0, 10, size= (3,3)) 
>>>x 
array([[4, 9, 1], 
[7, 4, 9], 
[8, 9, 1]]) 
>>>rp.std(x) 
3.1544599036840864 
>>>rnp.std(x, axis= 1) 
array ([3.29983165, 2.05480467, 3.55902608]) 
>>>mnp.var (x, axis= 0) 
array ([2.88888889, 5.55555556, 14.22222222]) 
>>>np.sort (x, axis= 0) 
array([[4, 4 1], 
D0, 9, 1, 
[8, 9, 9]]) 
>>>np.sort (x, axis=1) 
array([[l, 4, 9], 
[4, 7, 9 
[1, 8, 9]) 


9. 改变 数组 大 小 


>>>ae=mp.arange(l, 11, 1) 
>>>a 

array([l, 2, 3, 4, 5, 6, 7, 8, 9, 10]) 
>>>a.shape=2, 5 

>>>a 


array(l[[1, 2, 3, 4 5], 
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# 二 维 数组 所 有 元 素 求 和 

# 二 维 数 组 纵向 求 和 

# 二 维 数组 横向 求 和 

# 二 维 数组 纵向 计算 算术 平均 值 


# 权 重 
# 二 维 数组 纵向 计算 加 权 平均 值 


# 所 有 元 素 的 最 大 值 
# 每 列 元 素 的 最 大 值 


# 创建 二 维 数组 


# 所 有 元 素 的 标准 差 
# 每 行 元 素 的 标准 差 
# 每 列 元 素 的 标准 差 


# 纵 向 排序 


# 横 向 排序 


坦 改 为 2 行 5 列 
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[6 7, 8, 9, 10]) 
>>>a.shape=5, -1 #-1 表 示 自 动 计算 
>>>a 
array([[1, 2], 

[3, 4, 

[5, 9g, 

[7, 8], 

[9, 10]]) 
>>>b=a.reshape (2,5) # reshape() 方 法 返回 新 数组 
>>>b 
array([[1, 2, 3, 4 5], 

[6 7, 8, 9, 10]]) 


10. 切片 操作 


>>>a mp.arange (10) 

>>>a 

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 

>>>a[::-1] # 反 向 切片 

array([9, 8, 7, 6 5, 4, 3, 2, 1, 0]) 

>>>a[::2] # 隔 一 个 取 一 个 元 素 

array([0, 2, 4, 6, 8]) 

>>>al[:5] # 前 5 个 元 素 

array([0, 1, 2, 3, 4]) 

>>> c=rp.arange (25) # 创 建 数组 

>>>c.shape= 5,5 # 修 改 数 组 大 小 

>>>c 

array([[0，1l，2，3，4， 
[5 6 7 8，9]， 
[10, 11, 12, 13, 14], 
[15, 16, 17, 18, 19], 
[20, 21, 22, 23, 24]]) 





>>>c[0, 2:5] # 第 0 行 中 下 标 [2,5) 之 间 的 元 素 值 

array([2, 3, 4]) 

>>>c[1l] # 第 0 行 所 有 元 素 

array([5, 6, 7, 8, 9]) 

>>>c[2:5, 2:5] # 行 下 标 和 列 下 标 都 介 于 [2,5) 之 间 的 元 素 值 


array{([[12, 13, 14], 
[17, 18, 19], 
[22, 23, 24]]) 


11. 布尔 运算 


>>> 芝 mp.random.rand(10) # 包 含 10 个 随机 数 的 数组 
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>>>x 
array([ 0.56707504, 0.07527513, 0.0149213 , 0.49157657, 0.75404095, 
0.40330683， 0.90158037， 0.36465894, 0.37620859， 0.62250594]) 
>>>>0.5 # 比 较 数组 中 每 个 元 素 值 是 否 大 于 0.5 
array([ True, False, False, False, True, False, True False, False, True], dtype=bool) 
>>>x[x> 0.5] # 获 取 数 组 中 大 于 0.5 的 元 素 
arTray([ 0.56707504, 0.75404095, 0.90158037, 0.62250594]) 
>>>aemp.-.array([l, 2, 3]) 
>>>b=rp.array([3, 2, 1]) 
>>>a>b # 两 个 数组 中 对 应 位 置 上 的 元 素 比较 
array([False，Eelse， True]，dtype=bool) 


>>>a==b 
array([False, True, False], dtype=bool) 
>>>a[la==b] 





array([2]) 


12. 广播 


>>>a= mp.arange (0, 60,10) .reshape (- 1,1) # 列 向 量 
>>>br mp.arange(0,6) # 行 向 量 
>>>a 
array([[ 0], 
[10], 
[20], 
[30], 
[40], 
[50]]) 
>>>b 
array([0, 1, 2, 3, 4, 5]) 
>>>atb # 广 播 
array([[0, 1, 2, 3, 4 95, 
[10, 11, 12, 13, 14, 15], 
[20, 21, 22, 23, 24, 25], 
[30, 31, 322, 33, 34, 35], 
[40, 41, 42, 43, 44, 45], 
[50, 51, 52, 53, 54, 55]]) 
330 
array([[ 0, 0, 0, 0 
[ 0 10, 20, 30, 40, 50], 


中 
号 


[ 
[ 0， 30， 60， 90， 120, 150], 
[ 


吕 
内 
时 
E 
8 
Ei 
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[ 0, S50, 100, 150, 200, 250]]) 


13. 分 段 函数 


>>> 三 mp.random.randint (0, 10, size= (1,10)) 

>>>x 

array([[0, 4, 3, 3, 8, 4, 7, 3, 1, 7]]) 

>>>mp.where(x< 5, 0, 1) # 小 于 5 的 元 素 值 对 应 0, 其 他 对 应 1 
array([[0, 0, 0, 0, 1, 0, 1, 0, 0, 1]]) 

# 小 于 4 的 元 素 乘 以 2, 大 于 7 的 元 素 乘 以 3, 其 他 元 素 变 为 0 

>>> mp-piecewise (x, [x< 4, 32 7], [lanbda x:xx 2, larbda x:x* 3]) 

array([[0, 0, 6, 624 0, 0 6 2, ， 0]) 


14. 计算 唯一 值 以 及 出 现 次 数 


>>>*= mp.random.randint (0,10,7) 
和 
array([8, 7, 7, 5, 3, 8, 0]) 
>>>np.binoount (x) # 元 素 出 现 的 次 数 ,0 表示 出 现 1 次 
array([1 0, 0, 1, 0, 1, 0, 2, 2], dtype= int64) 
#1、2 表 示 没 出 现 ,3 表示 出 现 1 次 ,以 此 类 推 


>>>rp.sm( ) # 所 有 元 素 出 现 次 数 之 和 等 于 数组 长 度 
电 

>>> len(x) 

>>>nmp.unique (x) # 返 回 唯一 元 素 值 


array([0, 3, 5, 7, 8]) 

>>> 汪 = mp.random.randint (0,10,2) 
>>>x 
array([2, 1]) 

>>>mp.bincount (x) # 结 果 数 组 的 长 度 取决 于 原始 数组 中 最 大 元 素 值 
array([0，1，1]，dtype= int64) 

>>> 王 mp.randcm.randint(0，10，10) 


>>>x 





array([3 6, 4, 5, 2, 9, 7, 0, 9, 0]) 


>>>y mp.random.rand (10) # 随 机 小 数 ,模拟 权重 
>>> 产 mp.round_ (y, }) # 保 留 一 位 小 数 
>>>y 


array([ 0.6, 0.8, 0.8, 0., 0.6, 0.l, 0., 0.2, 0.8, 0.7]) 
>>>rp.amfxx /rp.samfrp.binoount 回 舌 加 权 总 和 /出 现 总 次 数 或 元 素 个 数 
2.9199999999999999 





15. 和 矩阵 运算 


>>>a list= [3, 5 7] 

>>>a mat=np.matrix(a list) 
>>>a mat 

matrix([[3, 5, 7]]) 

>>>a mat.T 

matrix([[3], 

[5], 

[7]]) 
>>>a mat.shape 
(1, 3) 
>>>a mt.size 
3 
>>>b mat=np.matrix((l， 2, 3)) 
>>>b mat 
matrix([[l, 2, 3]]) 
>>>a mt * b mat.T 
matrix([[34]]) 
>>>a mat.mean() 

5.0 

>>>a rat.sum() 

15 

>>>a mat.max() 

时 

>>>c mat=np.matrix([[l, 5, 3], [2, 9, 6]]) 
>>>c mt 

matrix([[l, 5, 3], 

2, 9, 6]]) 
>>>c mat.argsort (axis= 0) 
matrix([[0, 0, 0], 

[1, 1, 1]], dtype= int64) 
>>>c mat.argsort (axis=1) 
matrix([[0, 2, 1], 

[0, 2, 1]], dtype= int64) 
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## 创 建 和 矩阵 


# 和 矩阵 转 置 


# 和 矩阵 形状 


# 矩 阵 相 乘 
# 元 素平 均值 


# 所 有 元 素 之 和 
# 创建 二 维 矩 阵 


# 纵 向 排序 后 的 元 素 序号 


# 横 向 排序 后 的 元 素 序号 


>>>d mat— rnp.matrix([[l, 2, 3], [4, 5, 6], [7, 8, 9]) 


>>>d mat.diagonal () 

matrix([[l, 5, 9]]) 

>>>d mat.flatten() 

matrix([[l, 2, 3, 4, 5, 6 7, 8 9]) 


# 和 矩阵 的 对 角 线 元 素 


# 和 矩阵 平 铺 
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13.2 科学 计算 扩展 库 scipy 


scipy 是 专门 为 科学 计算 和 工程 应 用 设计 的 Python 工具 包 , 在 numpy 的 基础 上 增加 
了 大 量 用 于 科学 计算 和 工程 计算 的 模块 ,包括 统计 、 优 化 整合 .线性 代数 、 常 微分 方程 数 
值 求 解 , 信 号 处 理 、 图 像 处 理 、 稀 玖 和 矩阵 等 。scipy 工具 包 的 主要 模块 如 表 13-1 所 示 。 


表 13-1 scipy 工具 包 的 主要 模块 






































模 块 说 有 明 
constants 常数 
special 特殊 函数 
数值 优化 算法 ,如 最 小 二 乘 拟 合 (leastsq) 、 函 数 最 小 值 (fmin 系列 ) 、 非 线性 方程 组 求 
解 (fsolve) 等 
interpolate 插值 (interpld interp2d 等 ) 
integrate 数值 积分 
signal 信号 处 理 
i 图 像 处 理 ,包括 滤波 器 模块 filters、 传 里 叶 变 换 模 块 fourier、 图 像 插值 模块 
Pe interpolation. 图 像 测量 模块 measuremznts 形态 学 图 像 处 理 模块 morphology 等 
Stats 统计 
misc 提供 了 读 取 图 像 文 件 的 方法 和 一 些 测试 图 像 
io 提供 了 读 取 Matlab 和 FORTRAN 文件 的 方法 


1321 数学 、 物 理 常用 常数 与 单位 模块 constants 


scipy 工具 包 的 常数 模块 constants 包含 大 量 用 于 科学 计算 的 常数 ,下 面 给 出 其 中 几 个 ， 
更 多 的 可 以 登录 http://docs. scipy. org/ doc/scipy/reference/constants, html 网 站 查看 。 
例如 ,可 以 使 用 下 面 的 方法 来 访问 该 模块 中 预定 义 的 常数 。 


>>> fram scipy import constants as C 


>>>C.pi # 圆 周 率 
3.141592653589793 

>>>C.golden # 黄 金 比 例 
1.618033988749895 

>>>C.c # 真 空中 的 光速 
299792458.0 

>>>C.h # 普 朗 克 常 数 
6.62606896s- 34 

>>>C.mile # 一 英里 等 于 多 少 米 


1609.3439999999998 
>>>C.ingh 


# 一 英寸 等 于 多 少 米 
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0.0254 

>>>C.degree # 一 度 等 于 多 少 弧度 
0.017453292519943295 

>>>C-minute # 一 分 钟 等 于 多 少 秒 
60.0 

>>>C.g 考 标 准 重 力 加 速度 
9.80665 


1322 特殊 函数 模块 special 
scipy 工具 包 的 special 模块 包含 了 大 量 函 数 库 , 包 括 基本 数学 函数 和 很 多 特殊 函数 。 


>>> fram scipy import special as S 

>>>S.dort (8) # 立 方 根 

2.0 

>>> S.expl0(3) #10x#3 

1000.0 

>>> S.sindg(90) # 正 弦 函 数 ,参数 为 角度 
1.0 

>>>S.round(3.1) # 四 会 五 人 函数 
3.0 

>>>S.round(3.5) 

4.0 

>>>S.round(3.499) 

3.0 

>>>S.cab(5,3) # 从 5 个 中 任 选 3 个 的 组 合 数 
10.0 

>>>S.pern(5,3) # 排 列 数 

60.0 

>>>S.gamma(4) # gamma 函数 
6.0 

>>>S.beta (10，200) # beta 函数 
2.839607777781333e- 18 

>>>S.sinc(0) # sinc 函数 

1.0 


1323 信号 处 理 模 块 Signal 


signal 模块 包含 大 量 滤波 函数 、B 样 条 插值 算法 等 。 下 面 的 代码 演示 了 一 维 信号 的 
卷 积 运算 : 

>>> import numpy as mp 

>>> 六 mpD-array([1，2,，3]) 

>>>h=nmp-array([4，5， 旨 ) 

>> > import scipy.signal 








>> > scipy.signal.convolve (x, h) # 一 维 卷 积 运算 
array([ 4, 13, 28, 27, 18]) 


下 面 的 代码 演示 了 二 维 图 像 卷 积 运算 ,运行 结果 如 图 13-1 所 示 。 
jmport mmpy as mp 
import matplotlib.pyplot as plt 


image=misc. lena() # 二 维 图 像 数 组 ,lena 图 像 
Ww mp.zeros((50, 50)) # 全 0 二 维 数组 , 卷 积 核 
w[0] [0]=1.0 # 修 改 参 数 ,调整 滤波 器 
w[49] [25]=1.0 # 可 以 根据 需要 调整 
image_new= signal .fftconvolve (image, Ww) # 使 用 FET 算 法 进行 卷 积 
plt.figure() 

Plt.imshow (image_new) # 显 示 滤 波 后 的 图 像 
plt.gray() 

plt.title('Filtered imge') 

plt.show() 





13-1 lena 图 像 处 理 结果 


下 面 的 代码 对 lena 图 像 进行 模糊 ,运行 结果 如 图 13-2 所 示 。 

image=misc.lena() 

w= signal .gaussian (50, 10.0) 

image_ new= signal .sepfir2d (image, w, W) 

中 值 滤波 是 数字 信号 处 理 、 数 字 图 像 处 理 中 常用 的 预 处 理 技术 ,特点 是 将 信号 中 每 个 
值 都 替换 为 其 邻 域内 的 中 值 , 即 邻 域内 所 有 值 排 序 后 中 间 位 置 上 的 值 。 下 面 的 代码 演示 
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100 200 300 400 
图 13-2 lena 图 像 模糊 处 理 结果 


了 scipy 模块 的 中 值 滤波 算法 的 用 法 。 


> >> import randcm 

> > > import numpy as mp 

>>> ijmport scipy.signal as signal 
>>>= np.arange(0, 100, 10) 


> >> randem. shuffle (x) # 打 乱 顺序 
>>>x 

array([40， 0, 60, 20, 50, 70, 80, 90, 30, 10]) 

>>> signal .medfilt (x,3) # 中 值 滤波 


array([ 0.， 40.， 20., 50.， 50.， 70., 80., 80., 30., 10.]) 


1324 图 像 处 理 模块 ndimage 


模块 ndimage 提供 了 大 量 用 于 N 维 图 像 处 理 的 方法 ,下 面 仅 选取 一 部 分 进行 演示 ， 
更 多 的 用 法 可 以 参考 官方 文档 。 


1. 图 像 滤波 

> >> fram scipy import misc 

>>> fram scipy import ndimage 

> >> import matplotlib.pyplot as plt 

>>> face=misc.face() # face 是 测试 图 像 之 一 
>>>Plt.figure() # 创建 图 形 
>>>Plt.imshow(face) # 绘 制 测试 图 像 
>>>Plt.show() # 原 始 图 像 , 如 图 13-3 所 示 


>>>blurred facer ndimage.gaussian filter (face, sigre=7) 






4 
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# 高 斯 滤波 
>>>Plt.imshow(blurred face) 
>>>Plt.show() # 高 斯 滤波 图 像 , 如 图 13- 4 所 示 
>>>blurred facel= ndimage.gaussian filter (face, sigre=1) 

# 以 下 3 行为 边缘 锐 化 
>>>blurred face3- ndimage.gaussian filter (face, sigme= 3) 
>>> sharp face=blurred face3+ 6* (blurred face3- blurred facel) 


>>>plt.imshow (sharp face) # 见 图 13-5 
>>>plt.show() 
>>>median face=ndimage.median filter(face, 7) ， # 中 值 滤波 
>>>Plt.imshow (median face) # 见 图 13- 6 
>>>Plt.show() 





图 13-3 原始 图 像 





400 600 


图 13-4 高 斯 滤波 结果 
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图 13-5 边缘 锐 化 结果 
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图 13-6 ”中 值 滤波 结果 


2. 图 像 测量 


> > > ndimage .measurements .maximm(face) # 最 大 值 

255 

> > > ndimage .measurements .maximm position (face) # 最 大 值 位 置 
(242, 560, 2) 

> > > ndimage .measurements .mean (face) # 平 均值 
110.16274388631184 

> > > ndimage .measurements .median (face) # 中 值 

109.0 

>>>ndimage measurements.sum(face) 

259906521 
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> > > ndimage.measurements.variance (face) 
3307.17544034096 

> >> ndimage .measurements.standard deviation (face) 
57.508046744268405 

>>>ndimage 





ts.histogram(faoce, 0, 255, 256) 


3. 使 用 scipy 进行 多 项 式 计算 与 符号 计算 


>>> fram scipy import polyld 
>>>pl= polyld([1,2,3,4]) 
# 输 出 结果 中 ,第 一 行 的 数字 为 第 二 行 对 应 位 置 项 中 x 的 指数 
>>> print (pl) 
学 2 
1xt2xt3xt4 
# 等 价 于 pe= (x- (x2) G3) (x-4) 
>>>p=polyld([1,2,3,4], True) 
>>> print (p?) 
4 3 2 
1 x- 10 x+ 35 x- 50 x+ 24 
# 使 用 = 作为 变量 
>>>P3= polyld([1,2,3,4]，variable= 'z') 
>>> print (p3) 
3 4 
12z+22z+32zt4 
# 把 多 项 式 中 的 变量 替换 为 指定 的 值 
>>>Pl(0) 
4 
>>>p1(]) 
10 
# 计 算 多 项 式 对 应 方程 的 根 
>>>pl.r 
array ([- 1.65062919+ 0.j，- 0.17468540+ 1.54686889j, — 0.17468540- 1.54686889j]) 
>>> pl (pl.r[0]) 
(~ 8.8817841970012523e- 16+ 0j) 
# 查 看 和 修改 多 项 式 的 系数 
>>>pl.c 
array([l, 2, 3, 4]) 
>>> Print (p3) 
寻 之 
1zt2z+t3zt4 
>>>p3.c[0]=5 
>>> print (p3) 
3 4 
5zt2z+t3zt4 
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# 查 看 多 项 式 的 最 高 阶 
>>>pl.order 

3 

# 查 看 指定 指数 对 应 的 项 的 系数 
# 例 如 ,在 pl 多项式 中 ,指数 为 3 的 项 的 系数 为 1 
>>>pl[3] 

于 

>>>Pl[0] 

4 

# 加 \ 减 ,乘除 、 朝 运算 

>>> print (pl) 

党 呈 
1xt2xt3xt4 
>>>print (- pl) 

3 2 
-1x-2x-3x-4 
>>> print (p2) 

4 3 2 
1x-10 xt+35x-50xt24 
>>> print (pl+ 3) 

村 必 
3 
>>> print (pl+ p2) 

4 3 2 
1x-9xt37x-47x+t28 
>>> print pl- 5) 

有 2 
1xt2xt3x-1 
>>> Print (p2- pl) 

4 3 2 
1x-1]xt33x-53xt20 
>>>print (pl * 3) 

Ei 
3xt6xt9xt12 
>>> print (pl * P2) 

7 6 5 a » 受 
1x-8xt18x-6x-1] xt38x-128 xt96 


>>> print (pl * p2/p2) 

(polyld([ 1., 2., 3., 4.]), polyla([ 0.])) 

>>> print (p2/pl1) 

(polyld([ 1., ~- 12.]), polyld([ 56., ~ 18., 72.])) 
# 多 项 式 的 寡 运 算 


>>> Print (pl xx 2) 
站 
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1 xt+4xt10 x+H20 x+H 25 xt24 xt16 
>>>print (pl * pl) 

6 5 4 -1 4 
1xt4xt10 xt+20 x+25 xt24 x+16 
# 一 阶 导数 
>>>print (pl.deriv()) 
3xt4xt3 
# 二 阶 导 数 
>>> print (pl.deriv (2)) 


6xt4 
# 多 项 式 的 不 定 积分 ,一 重 不 定 积分 , 设 常数 项 为 0 
>>>print (pl.integ(e=1, 二 0)) 
4 2 
0.25 x+ 0.6667 x+1.5 xt 4x 
# 二 重 不 定 积分 , 设 常数 项 为 3 
>>>print (pl.integte= 2, k=3)) 
5 4 EW 
0.05 x+ 0.1667 x+ 0.5 x+ 2 x+ 3 x+t3 


13.3 扩展 库 pandas 简介 


pandas(Python Data Analysis Library) 是 基于 numpy 的 数据 分 析 模 块 ,提供 了 大 量 
标准 数据 模型 和 高 效 操作 大 型 数据 集 所 需要 的 工具 ,可 以 说 pandas 是 使 得 Python 能 够 
成 为 高 效 且 强 大 的 数据 分 析 环 境 的 重要 因素 之 一 。 

pandas 主要 提供 了 3 种 数据 结构 : Series, 带 标签 的 一 维 数组 ; @DataFrame, 带 标 
签 且 大 小 可 变 的 二 维 表格 结构 ; @Panel, 带 标签 且 大 小 可 变 的 三 维 数组 。 

可 以 在 命令 提示 符 环境 使 用 pip 工具 下 载 和 安装 pandas, 然 后 按照 Python 社区 的 习 
惯 ,使 用 下 面 的 语句 导入 : 





> > > import pandas as pd 


1. 生成 一 维 数组 


>>> import numpy as np 
>>> 玉 pd.Series([1，3，5，np.nan]) 


2. 生成 二 维 数组 


>>> dates=pd.date range (start= "20130101', end= '20131231', freq= 'D') 
# 间 隔 为 天 
>>> dates=pd.date range (start= "20130101', end= '20131231', freq= 'M') 
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# 间 隔 为 月 
>>> dE- pd.DataFrame (rp.randm.randn (12, 4), indese dates，colums= list ("ABD')) 
>>> dE- pd.DataFrame ([ [np. randem. randint (1, 100) for j in range (4)] for i in range (12)], index= dates, 
colums= list ('ABCD')) #4 列 随机 数 
>> > dE- pd.DataFrame ({'A': [np.randcm.randint (1, 100) for i in range (4)], 
"B'spd.date range (start= "20130101', periods=4, freq 'D'), 
‘C'spd.Series ([, 2, 3, 4],indee list (range (4)),dtype= ‘foat'), 
'D':mp.aray([3] * 4dbyper int32)v 
E'spd.Categorical (["best", "train", "test", "train"]), 
FE':"fo0'}) 
>>> df pd.DataFrame ({'A': [np.random.randint (1, 100) for i in range (4)], 
'B':pd.date range (start= '20130101', periods= 4, freq= 'D'), 
'C':pd.Series([1, 2, 3, 4],index= ['zhang', 'li', 'zhou', ‘wang'],dtype= "float32'), 
"D':np.array([3] * 4,dtype= "int32'), 
'E':pd.Categorical (["test", "train", "test", "train"]), 


foo0') 
3. 二 维 数据 查看 
>>>df.head() # 默 认 显示 前 5 行 
>>>df.head(3) # 查 看 前 3 行 
>>>df.tail(2) # 查 看 最 后 2 行 


4. 查看 二 维 数据 的 索引 、 列 名 和 数据 


>>>df.index 
>>>df.columns 
>>>df.values 


5. 查看 数据 的 统计 信息 


>>>df.describe() # 返 回 平均 值 .标准 差 , 最 小 值 、 最 大 值 等 信息 


6. 二 维 数据 转 置 


>>>df.T 


7. 排序 


>>> df.sort index (axis= 0, ascending False) # 对 轴 进 行 排序 
>>> df.sort index (axis- 1, ascending= False) 

>>> df.sort values (oy= 'A') # 对 数据 进行 排序 
>>> of.sort values (oy- 'A', ascending- False) ## 降 序 排列 
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8. 数据 选择 


>>>qf['A'] 

>>>qf[0:2] 

>32EE.6c[ Pa Cll 
>>>qf.loc[['zhang', 'zhou'], ['A', 'D', 'E']] 
>>>qdf.loc['zhang', ['A', 'D', 'E']] 
>>>qdf.at['zhang', 'A'] 
>>>df.at['zhang', 'D'] 
>>>df.iloc[3] 
>>>df.iloc[0:3，0:4] 
>>>df.iloc[[0, 2, 3], [0, 4]] 
>>>dqdf.iloc[0,1] 

>>>df.iloc[2,2 

>>>dqdf[df.2> 50] 


9. 数据 修改 与 设置 


>>>df.iat[0, 2]=3 


# 选 择 列 

# 使 用 切片 选择 多 行 

# 选 择 多 列 

# 同 时 指定 多 行 与 多 列 进行 选择 


# 查 询 指定 行列 位 置 的 数据 值 
# 查 询 第 3 行 数据 

# 查 询 前 3 行 ,前 4 列 数据 

# 查 询 指定 的 多 行 、. 多 列 数据 

# 查 询 指定 行列 位 置 的 数据 值 


# 按 给 定 条 件 进 行 查询 


# 修改 指定 行 、 列 位 置 的 数据 值 


>>>df.loc[:，'D']= [mp.randcm.randint(50，60)for i in range (4)] 


>>>df['c'"]=-df['c'] 


# 修改 某 列 的 值 
# 对 指定 列 数据 取 反 


10. 缺失 值 处 理 (缺失 值 和 异常 值 处 理 是 大 数据 预 处 理 环节 中 很 重要 的 一 个 步骤 ) 


> > > dfl= df. reindex (index= ['zhang' 


colums)+ ['G']) 
>>>dfl.iat[0，6]=3 
>>>pd.isnull (dfl) 

>>>dfl.dropna() 
>>>dfl['G'] .人 illna(5，inplace= True) 


11. 数据 操作 


>>>dfl.mean() 

>>>df.mean(l) 

>>>dfl.shift() 
>>>df1['D'] .value counts() 

> >> df2= pd.DataFrame (rp.random.randn (10, 4)) 
>>>pl= df2[:3] 

>>>P2- df2[3:7] 

>>>Pp3=- df2[7:] 

>>> df3-pd.concat ([pl, p2, p3]) 

>>>df2 ==df3 


"li', 'zhou', 'wang'], ，columns= list (df. 


# 修 改 指定 位 置 的 元 素 值 ,该 列 其 他 元 素 为 缺失 值 NaN 
# 测 试 缺 失 值 ,返回 值 为 True/False 阵 列 


# 返 回 不 包含 缺失 值 的 行 
# 使 用 指定 值 填充 缺失 值 


# 平 均值 ,自动 忽略 缺失 值 
# 横 向 计算 平均 值 

# 数 据 移 位 

# 直 方 图 统计 


## 数 据 行 拆 分 


# 数 据 行 合并 


# 测 试 两 个 二 维 数 据 是 否 相等 ,返回 True/False 阵 列 
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>>> df 和 pd.Datagrame ({'A': [np.random.randint (1,5) for i in range (8)], 
'B': [np.random.randint (10, 15) for i in range (8)], 
‘'C': [np.random. randint (20, 30) for i in range (8)], 
'D': [np.random.randint (80, 100) for i in range (8)]}) 
>>>df4.groupby ('A') .sum() # 数 据 分 组 计算 
>>> qf4.groupby (['A', 'B']) -mean() 


12. 结合 matplotlib 绘图 


> >> jimport pandas as pd 

>>> jimport numpy as rp 

>>> import matplotlib.pyplot as plt 

>>> df= pd.DataFrame (np.randem.randn (1000, 2), colums= ['B', 'C']) .cumsum() 
>>>df['A']=pd.Series (list (range (len (df)))) 

>>>plt.figure() 

>>>df.plot (= 'A') 

>>>Plt.show() 


代码 运行 结果 如 图 13-7 所 示 。 
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图 13-7 绘制 曲线 图 结果 


下 面 的 代码 用 来 绘制 柱状 图 ,结果 如 图 13-8 所 示 。 


>>> df pd.DataFrame (np.randcm.rand(10，4)，columns= ['a', 'b', 'c', 'd']) 
>>>df.plot (kind= 'bar') 
>>>plt.show() 


将 上 面 代码 中 的 绘图 语句 改 为 
>>> df.plot (kind- ‘barh', stacked- True) 


运行 结果 如 图 13-9 所 示 。 
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图 13-9 水 平 柱状 图 绘制 结果 
13. 文件 读 写 
>>> df5.to eal('d:\\test.xlsx', shest name= 'dfg') ”将 数据 保存 为 Excal 文 件 
>>> df6=pd.read eel ('d:\\test.xlsx', ‘dfg', index col= None, na values= ['NA']) 
>>>df6.to csv('d:\\test.csv') # 将 数据 保存 为 csv 文 件 
>>>df 太 Pd.read csv('d:\\test.csv') # 读 取 csv 文 件 中 的 数据 


14. 精彩 案例 赏析 


假设 有 个 Excel 2007 文件 “电影 导演 演员 . xlsx”, 其 中 有 三 列 分 别 为 电影 名 称 、 导 演 
和 演员 列表 (同一 部 电影 可 能 会 有 多 个 演员 ,每 个 演员 姓名 之 间 使 用 逗号 分 隔 ), 如 
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图 13-10 所 示 。 要 求 统计 每 个 演员 的 参 演 电影 数量 ,并 统计 最 受 欢迎 的 前 3 名 演员 。 





















6 电影 5 导演 2 演员 1 ， 演 员 2 ， 演 员 3 ， 演 员 8 
7_ 电影 6 导演 3 演员 5， 演 员 7 ， 演 员 3 ， 演 员 9 
8 电影 7 导演 4 演员 1 ， 演 员 4 ， 演 员 6 ， 演 员 7 
9 _ 电影 8 导演! 演员 1 ， 演 员 4 ， 演 员 3 ， 演 员 8 
10 电影 9 导演 2 演员 5， 演 员 4， 演 员 3， 演 员 9 
11 ,电影 10 导演 3 演员 1 ， 演 员 4 ， 演 员 5， 演 员 10 
12 ,电影 11 。 导演 1 演员 1 ， 演 员 4 ， 演 员 3 ， 演 员 11 
13 | 电影 12 ”导演 2 演员 7 ， 演 员 4 ， 演 员 9， 演 员 12 
14 电影 13 导演 3 演员 1 ,演员 7 ， 演 员 3， 演员 13 
15 电影 14 导演 4 演员 10， 演 员 4， 演 员 9， 演员 14 
16 | 电影 15 ”| 导演 5 “演员 1 ， 演 员 8 ， 演 员 11 ,演员 15 
17 ,电影 16 导演 6 演员 14， 演 员 4， 演 员 13， 演 员 16 
18 电影 17 ; 演员 3， 演 员 4 ， 演 员 9 
19 电影 18 演员 3 ， 演 员 4 ， 演 员 10 





13-10 “电影 导演 演员 . xlsx” 文 件 中 的 内 容 


>>> inmport pandas as pd 
>>> df=pd.read _ excel (" 电 影 导 演 演员 .xlsx') 
>>>pairs= [] 
>>> for i in range (len(df)): 
actors=df.at[i, ' 演 员 '].split(',') 
for actor in actors: 
pair= (actor, df.at[i, ' 电 影 名 称 ']) 
Pairs.append (pair) 
>>> pairs= sorted (pairs, key= lanbda item:int (item[0] [2:])) 
>>> index= [item[0] for item in pairs] 
>>> datar [item[1] for item in pairs] 
>>> dfl= pd.DataFrame({' 演 员 ':index, ' 电 影 名 称 ':data}) 
>>> result= dfl.groupby(' 演 员 '， as_index= False) .count () 
>>> result.colums= [" 演 员 '，' 参 演 电 影 数量 ] 
>>> result.nlargest (3,' 参 演 电影 数量 ') 
演员 参 演 电 影 数量 
10 演员 4 13 
9 演员 3 12 
0 演员 1 10 


13.4 统计 分 析 标 准 库 statistics 用 法 简介 


Python 标准 库 statistics 提供 了 大 量 方法 用 于 计算 数值 数据 的 数理 统计 信息 。 
1. 计算 平均 数 函 数 mean() 


>>> import statistics 


时 
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>>>statistics.mean([1, 2, 3, 4, 5, 6 7, 8, 9) ## 使 用 包含 整数 的 列表 做 参数 
5.0 
>>> statistics.mean (range (1,10)) # 使 用 range 对 象 做 参数 
5.0 


>>> import fractions 

>>>= [(3, 7), (1, 21),(5, 3), (1, 3)] 

>>>y [fractions.Fraction(* item) for item in x] ## 创 建 包含 分 数 的 列表 
>>>Y 

[Eracticn (3，7)，Eraction (1，21)，Fraction (5，3)，Fracticn(l， 3)] 

>> > statistics.mean(y) # 使 用 包含 分 数 的 列表 做 参数 
Eraction (13，21) 

>>> import decimal 

>>>x= ("0.5'，"0.75'，"0.625'，"0.375") 

>>>y=map(decimal.Decimal, x) 

>>> statistics.mean(y) 

Decimal ('0.5625') 


2. 中 位 数 函 数 median() .median_low() .median_high() .median_grouped() 


>> > statistics.median([1, 3, 5, 7]) # 偶 数 个 样本 时 取 中 间 两 个 数 的 平均 数 
4.0 

>>> statistics.median low([1, 3, 5, 7]) “偶数 个 样本 时 取 中 间 两 个 数 的 较 小 者 
3 

>>> statistics.median high([1, 3, 5, 7]) # 偶 数 个 样本 时 取 中 间 两 个 数 的 较 大 者 
5 

>> > statistics.median (range(1,10)) 

5 

> > > statistics.median low([5，3，7])，statisticsmedian high([5, 3, 7]) 

(5, 5) 

>>> statistics.median grouped([5, 3, 7]) 

5.0 

> > > statistics.median grouped([52, 52, 53, 54]) 

52.5 

> > > statistics.median grouped([1, 3, 3, 5, 7]) 

3.25 

>>> statistics.median grouped([l, 2, 2, 3, 4, 4, 4, 4, 4, 5]) 

3.7 

>>> statistics.median grouped([l, 2, 2, 3, 4, 4, 4, 4, 4, 5], interval=2) 

3.4 


3. 返回 最 常见 数据 或 出 现 次 数 最 多 的 数据 的 函数 mode() 


>>> statistics.mode([1, 3, 5, 7]) # 无 法 确定 出 现 次 数 最 多 的 唯一 元 素 
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statistics.StatisticsError: no unigue mode; found 4 equally omon values 
>>> statistics.mde([1, 3, 5, 7, 3]) 

3 

> > > statistics.mde (["red", "blue", "blue", "red", "green", "red", "red"]) 
wedr 


4. pstdev() 


pstdev() 返 回 总 体 标准 差 。 


> > > statistics.pstdev([1.5，2.5，2.5，2.75，3.25，4.75]) 
0.986893273527251 

> > > statistics.pstdev (range (20)) 

5.766281297335398 


5. pvariance() 
pvariance() 返 回 总 体 方差 或 二 次 矩 。 


>>> statistics.pvariance([1.5，2.5，2.5，2.75，3.25，4.75]) 
0.9739583333333334 

>>> 二 [1, 2, 3, 4, 5, 10, 9, 8, 7, 6] 

>>>me statistics.mean (x) 

>>>m 

5.5 

>>> statistics.pvarianoe([1, 2, 3, 4, 5, 10, 9, 8, 7, 6€], m) 
8.25 

> >> statistics.pvarianoe (range (20)) 

33.25 

> >> statistics.pvarianoe( (random.randint (1, 10000) for i in range (30))) 
10903549.933333334 


6. variance() stdev() 
计算 样本 方差 和 样本 标准 差 。 


>>> statistics.variance (range (20)) 

35.0 

>>> statistics.stdev (range (20)) 

5.916079783099616 

和 

35.0 

>>> statistics.varianoe([3, 3, 3, 3, 3, 3]), statistics.stdev([3, 3, 3, 3, 3, 3]) 
(0.0, 0.0) 
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13.5 matplotlib 


matplotlib 模块 依赖 于 numpy 模块 和 tkinter 模块 ,可 以 绘制 多 种 形式 的 图 形 , 包 括 
线 图 、 直 方 图 、 饼 状 图 、 散 点 图 ,误差 线 图 等 ,图 形 质量 可 满足 出 版 要 求 , 是 计算 结果 可 视 化 
的 重要 工具 。 


1351 绘制 正弦 曲线 


import nnpy as mp 
import pylab as pl 


t=np.arange (0.0, 2.0# np.pi, 0.01) # 生 成 数组 ,0- 2x 之 间 , 以 0.01 为 步 长 
s=mp.sin(t) # 对 数组 中 的 所 有 元 素 求 正 弦 值 ,得 到 新 数组 
pl-plot (t,s) # 画 图 ,以 t 为 横 坐 标 ,s 为 纵 坐 标 

pl.xlabel ('x') # 设 置 坐标 轴 标 签 

pl.ylabel('y') 

pl.title('sin’) # 设 置 图 形 标题 

pl.show() # 显 示 图 形 


运行 结果 如 图 13-11 所 示 。 














10 sin 
0.5 
> 00 
-0.5 
-1.0 
1 2 3 4 5 6 7 
其 


13-11 正弦 曲线 


1352 绘制 散 点 
下 面 的 代码 绘制 了 余弦 曲线 的 散 点 图 ,运行 结果 如 图 13-12 所 示 。 
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import numpy as mp 
import pylab as pl 


mp-.arange (0, 2.0* rp.pi, 0.1) 
b=nmp.cos (a) 














pl.scatter (a,b) # 绘 制 散 点 图 
PL.show() 
15 
10 
oe, ee 
加 8 
四 
. 
ee 
05 
。 。 
和 
有 。 
00 . 
。 
. 
和 . 
-0.5 的 De 
. 
oe KY 
动 你 oo 
-1.5 
-1 0 1 2 3 4 5 6 


散 点 图 是 分 析 数 据 相 关 性 常用 的 方法 ,下 面 的 代码 使 用 随机 数 生成 数值 然后 生成 散 
点 图 ,并 根据 数值 大 小 来 计算 散 点 的 大 小 ,运行 结果 如 图 13-13 所 示 。 


图 13-12 余弦 曲线 的 散 点 图 











12 





10 


图 13-13 散 点 图 
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import matplotlib.pylab as pl 
import nnpy as mp 


Mp.random.random(100) 
y= mp.random.random(100) 

Hl.scatter (x,y,s=x* 500,c=u'r' ,marker=u" * ') #s 指 大 小 ,c 指 颜色 ,marker 指 符号 形状 
pl.show() 


1353 绘制 饼 状 图 


import numpy as Pp 
import matplotlib.pyplot as plt 


# The slices will be ordered and plotted counter- clockwise. 

sizes= [15, 30, 45, 10] 

colors= ['yellowgreen', 'gold', '#FF0000', "lightooral'] 

explode = (0, 0.1, 0, 0.1) # 使 饼 状 图 中 第 2 片 和 第 4 片 裂 开 


fig-plt.figure() 

as fig.gcal) 

ax.pie (np.randcm.randcm(4) ，explode= explode, labels= labels, colors= oolors, 
autopct= '%1.1f%%', shadow= True, startangle= 90, 
radius= 0.25, oanter= (0, 0), frame= True) 

ax.pie (np.randcm.randcm(4) ，explode= explode, labels= labels, colors= colors, 
autopct= '%1.1f%%', shadow= True, startangle= 90, 
radius= 0.25, oenter= (1, 1), frame= True) 

ax.pie (np.randcm.randcm(4) ，explode= explode, labels= labels, colors= colors, 
autopct= '%1.1f%%', shadow= True, startangle= 90, 
radius= 0.25, oenter= (0, 1), frame= True) 

ax.pie (np.randcm.randcm(4) ，explode= explode, labels= labels, colors= colors, 
autopct= '%1.1f%%', shadow= True, startangle= %0, 
radius= 0.25, oenter= (1, 0), frame= True) 

ax.set_xticks([0, 1]) # 设 置 坐标 轴 刻 度 

ax.set yticks([0, 1]) 

ax.set_xticklabels(["Sunny", "Cloudy"]) # 设 置 坐标 轴 刻 度 上 显示 的 标签 

ax.set_ yticklabels(["Dry", "Rainy"]) 

ax.set xlim((- 0.5, 1.5)) # 设 置 坐标 轴 跨 度 

ax.set ylim((- 0.5, 1.5)) 

# Set aspect ratio to be equal so that pie is drawn as a circle. 

ax.set_ aspect ('equal') 


plt.show() 


程序 运行 结果 如 图 13-14 所 示 。 
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Rainy Hogs 

53.9%\ 0 

Logs Dogs Logs 
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32.4%, 
Dry 











Sunny Cloudy 
图 13-14 绘制 饼 状 图 


1354 绘制 带 有 中 文 标签 和 图 例 的 图 
import numpy as mp 
import pylab as pl 
jimport matplotlib.font manager as fm 


myfont= fm.FontProperties (fname= r'C:\Windows\ Fonts\STKAITI.ttf') 


# 设 置 字体 
t= np.arange (0.0, 2.0* np.pi，0.01) # 自 变量 的 取 值 范围 
二 mp.sintt) # 计 算 正 弦 函 数值 
z= np.003 (t) # 计 算 余 弦 函 数值 


PL.Plot tt，sy label= ' 正 弦 ') 
BPL.pPlot tt，z label= "余弦 
PL.xlabel ('x- 变量 '，fontproperties= 'SIKAITI', fontsize= 24) 
# 设 置 x 标 签 
也 .ylabel('y- 正 弦 余 弦 函 数值 ',， fontproperties= 'SIKAITI', fontsize= 24) 
了 及 -title('sin- cos 函数 图 像 '，fontproperties= 'SIKAITI', fontsize= 32) 
# 图 形 标题 
pl.legend (prop=myfont) # 设 置 图 例 
PL.show() 


运行 结果 如 图 13-15 所 示 。 
1355 绘制 图 例 标 签 中 带 有 公式 的 图 


import mnpy as mp 
import matplotlib.pyplot as plt 
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sin-cos 函 数 图 像 








-正弦 余弦 函数 值 














1 2 3 4 5 6 可 
x 变量 
图 13-15 中文 标 签 和 图 例 


rp.linspace (0, 2* np.pi, 500) 

mp.sin(x) 

z= rp.005 公关 x) 

plt.figure (figsize= (8,5)) 

# 标 签 前 后 加 $ 将 使 用 内 嵌 的 Iamex 引擎 将 其 显示 为 公式 
Plt.Plot (x,y, label= '$ sin (x)$ ',color= 'red', linewidth= 2) # 红 色 ,2 个 像素 宽 
plt.plot (xz 'b- - ',label= '$ cos (x°2)$ ') # 蓝 色 ,虚线 
plt.xlabel ("Time (s) ') 

plt.ylabel (‘Volt') 

plt.title('Sin and Cos figure using pyplot') 

plt.ylim(- 1.2,1.2) 

plt.legend() # 显 示 图 例 
Plt.show() 


运行 结果 如 图 13-16 所 示 。 
1356 使 用 pyplat 绘制 ,多 个 图 形 单独 显示 


import numpy as mp 
jimport matplotlib.pyplot as plt 


x mp.linspace(0，2* np.pi, 500) # 创 建 自 变量 数组 
yl=np.sin(x) # 创 建 函 数值 数组 
y 三 到 -005 四 

ym.sin(x* x) 

plt.figure(l) # 创 建 图 形 


# create three axes 
axl=plt.subplot (2,2,1) # 第 一 行 第 一 列 图 形 
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Sin and Cos figure using pyplot 









10 


05 


sin(x) 
cos(x2) 























划 0.0 
-0.5 
-10 
0 1 3 号 4 5 6 
Timels) 
图 13-16 标签 中 带 公式 的 图 
ax2=plt.subplot (2,2,2) # 第 一 行 第 二 列 图 形 
ax3- plt.subplot (2,1,2) # 第 二 行 
plt.sca(axl) # 选 择 axl 
plt.plot (x,yl, color= 'red') # 绘 制 红色 曲线 
plt.ylim(- 1.2,1.2) # 限 制 y 坐 标 轴 的 范围 
Plt.sca (ax2) # 选 择 ax2 
plt.plot (x,y2, b- — ') # 绘 制 蓝 色 曲 线 
plt.ylim(- 1.2,1.2) 
Plt.sca (ax3) # 选 择 ax3 
Plt.plot (x,y3,'g-—') 
plt.ylim(- 1.2,1.2) 
plt.show() 
运行 结果 如 图 13-17 所 示 。 
10 10 加 
人 Pa 
05 as 和 站 
、 ’ 
0.0 0.0 i 
\ / 
-0.5 -0.5 ` 
-1.0 -1.0 ~ 
0 ET 从 > 和 ”温和 人 -全 
10 ,~、 人 A A 
i 2 \ 1 \ ， ， 人 由 2 ， 
A 
| \ / \ 1 ， 1/ 1 1 wt 1 1 
-0.5 1 WT 和 证， 
\，， i 
-1.0 ut 人 7 忆 村 由 
0 1 3 3 4 :i 6 
图 13-17 多 图 形 同 时 显示 
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1357 绘制 三 维 参数 曲线 


jimport matplotlib as mpl 

fram mpl toolkits.mplot3d import Axes3D 
import nnpy as mp 

import matplotlib.pyplot as plt 


mpl.rcParams['legend.fontsize']=10 # 图 例 字 号 
fig=plt.figure() 

ax= fig.gca (projection= '3d') # 三 维 图 形 
theta= rp.linspace(- 4 * np.pi, 4 * np.pi, 100) 
=p.linspace(- 4, 4, 100) * 0.3 # 测 试 数据 
By#3+ 工 


II # np.sin(theta) 

交工 * JI.cos (theta) 

ax.plot (x, Y z, label= 'parametric curve') 
ax.legend!() 

Plt.show() 


程序 运行 结果 如 图 13-18 所 示 。 








-2 


图 13-18 绘制 三 维 参 数 曲线 


1358 绘制 三 维 图 形 
jimport numpy as mp 
import matplotlib.pyplot as plt 


import mpl toolkits-mplot3d 


x y= mp.mgrid[- 2:2:20j，- 2:2:20j] 
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二 50 * mp.sin(xty) # 测 试 数据 

ax= plt.subplot (111, projection= '3d') # 三 维 图 形 
ax.plot_ surface (x,y,2,r3atride=2, cstride=1, omap=plt.an.Blues I) 
ax.set xlabel ('X') # 设 置 坐标 轴 标签 


ax.set ylabel ('Y') 
ax.set zlabel ('2") 
plt.show() 


运行 结果 如 图 13-19 所 示 ,在 绘图 窗口 中 可 用 鼠标 指针 来 旋转 绘制 图 形 。 





图 13-19 绘制 三 维 图 形 ( 一 ) 


下 面 的 代码 绘制 了 另 一 个 略 加 复杂 的 三 维 图 形 ,运行 结果 如 图 13-20 所 示 。 





0.0 
0 
> 05 
ee 
-1.0 > 0.0 
0.0 05 


0.5 
10-10 


图 13-20 绘制 三 维 图 形 ( 二 ) 


import pylab as pl 
import numpy as mp 
import mpl toolkits.mplot3d 
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rho theta=rp.mgrid[0:1:40j, 0:2* mp.pi:40j] 
z= rhoxx2 

x rhox mp.cos (theta) 

rhox mp.sin(theta) 

a Pl.subplot (111, projection= '3d') 
ax.plot surface(x,y,2) 

pl.show() 


13.6 创建 词 云 


Python 扩展 库 wordcloud 可 以 用 来 制作 词 云 ,而 pillow 库 提供 了 图 像 处 理 功 能 ,可 
以 结合 两 者 创建 词 云 头像 ,把 给 定 的 图 像 作为 参考 ,只 保留 词 云 中 与 图 像 前 景 对 应 位 置 的 
像素 ,起 到 裁剪 作用 。 

下 面 的 代码 用 来 根据 给 定 的 字符 串 创 建 词 云 ,结果 如 图 13-21 所 示 。 


yhnbgfd abc 














| 
© 
(eB) 
Ss Python fegh 
hello 
图 13-21 词 云 效果 
jimport Irandcm 
import string 
import wordcloud 
def show(s) : 
# 创 建 wordcloud 对 象 
Wo= wordcloud.Wordcloud( 


Ir'C:\windows\ fonts\simfang.ttf', width= 500, height= 400, 
background color= ‘white', font step=3, 
random_ state= False, prefer horizontal= 0.9) 

# 创 建 并 显示 词 云 

t=wc.generate(s) 

t.to image() .save('t.png') 


# 如 果 空 间 足 够 ,就 全 部 显示 
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# 如果 词 太 多 ,就 按 频率 显示 ,频率 越 高 的 词 越 大 
show('''hello world 董 付 国 董 付 国 董 付 国 董 付 国 
abc fgh yhrbgfd 董 付 国 董 付 国 董 付 国 董 付 国 Python great Python Python ) 


下 面 的 代码 根据 图 13-22 生成 词 云 ,结果 如 图 13-23 所 示 。 


import string 
import randem 

fram PIL import Image 
import wordcloud 


Gef create (imgFile，s) : 
ime Image.open (imgFile) 
WwW, b= im.size 
# 创 建 wordcloud 对 象 
Wc= wordcloud.Wordcloud( 
I'C:\windows\ fonts\simfang.ttf', width=w, height=h, 
background color= ‘white', font_step=3, 
randem state= False, prefer horizontal= 0.9) 
# 创 建 并 显示 词 云 
t=wc.generate (3) 
tt.to image!() 
for wl in range (w) : 
for hl in range (hb) : 
if im.getpixel ((wl,hl)) [:3] == (255, 255, 255) : 
t.putpixel ( (wl,hl), (255,255,255)) 
t.save('result.png') 


hs= string.ascii letterst string.digits+ string.punctuation 
 ["'.join( (randam.dhoioe (chs) for i in range (8))) for j in range(650)] 
三 "' '.join(s) 


create('testl.png', 3) 


soart opxv5 | L 
Ww 
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13-22 ”作者 近 照 图 13-23 根据 作者 近 照 生成 的 随机 词 云 
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本 章 小 结 


(1) numpy 数组 支持 与 标量 和 数组 之 间 的 四 则 运算 。 

(2) numpy 数组 支持 同时 访问 多 个 元 素 。 

(3) numpy 数组 支持 切片 操作 。 

(4) 除了 数组 ,numpy 还 支持 大 量 和 矩阵 运算 。 

(5) Python 扩展 库 在 numpy 基础 上 增加 了 大 量 用 于 科学 计算 以 及 工程 计算 的 模块 ， 
包括 统计 、 优 化 、 线 性 代数 . 常 微分 方程 数值 求解 .信号 处 理 、 图 像 处理 和 稀 朴 矩阵 等 。 

(6) 扩展 库 scipy. constants 包含 了 大 量 用 于 科学 计算 的 常数 。 

(7) 扩展 库 scipy. signal 包含 了 大 量 滤波 函数 和 B 样 条 插值 算法 等 。 

(8) 扩展 库 scipy. ndimage 提供 了 大 量 用 于 图 像 处 理 的 方法 。 

(9) 扩展 库 pandas 是 基于 numpy 的 数据 分 析 模 块 ,提供 了 大 量 标准 数据 模型 和 高 效 
操作 大 型 数据 集 所 需要 的 工具 。 

(10) 标准 库 statistics 提供 了 大 量 方法 用 于 计算 数值 数据 的 数理 统计 信息 。 

(11) 扩展 库 matplotlib 依赖 于 numpy 和 tkinter, 可 以 绘制 多 种 形式 的 图 形 , 包 括 折 
线 图 .直方 图 、. 饼 状 图 和 散 点 图 等 。 


习 题 


13.1 选择 一 篇 英语 文章 ,分 析 其 中 每 个 单词 的 频次 ,并 使 用 柱状 图 进行 显示 。 
13.2 根据 习题 13. 1 中 的 文章 创建 词 云 ,并 创建 自己 喜欢 的 图 案 。 





附录 a 
p> 人 精彩 在 继续 


附录 A GUI 开发 


目前 适用 于 Python 的 GUI 库 主 要 有 wxPython、tkinter 和 PyQT, 其 中 wxPython 
似乎 更 强大 一 些 , 不 过 需要 额外 安装 才 行 ,虽然 这 并 不 麻烦 。 而 tkinter 是 Python 标准 
库 , 可 以 直接 使 用 ,也 具有 很 大 的 优势 。 关 于 wxPython 的 更 多 介绍 请 参考 作者 的 另外 一 
本 书 《4Python 程序 设计 (第 2 版 )》( 清 华 大 学 出 版 社 , 书 号 为 9787302436515) ,tkinter 的 
大 量 案例 代码 可 以 参考 作者 的 另外 一 本 书 (Python 可 以 这 样 学 》( 清 华 大 学 出 版 社 , 书 号 
为 9787302456469)。 这 里 再 通过 一 个 GUI 版 的 猜 数 游戏 介绍 一 下 tkinter 的 高 级 用 法 。 

把 下 面 的 代码 保存 并 运行 之 后 ,首先 需要 启动 游戏 并 设置 数值 范围 和 最 大 允许 猜 数 
次 数 ,然后 才能 在 文本 框 内 输入 猜测 的 数字 ,程序 会 提 
示 正 确 、 数 值 过 大 或 过 小 ,玩家 根据 提示 对 下 一 次 猜 数 FE 
进行 调整 ,超过 次 数 限制 之 后 游戏 结束 并 提示 正确 的 a 
数字 ,退出 程序 时 提示 战绩 。 游 戏 运行 初始 界面 如 
图 A.1 所 示 。 图 A.1 猜 数 游戏 运行 初始 界面 

import randcm 

import tkinter 

import tkinter.messagebox 

import tkinter.simpledialog 


root= tkinter.Tk() 
# 和 窗口 标题 
root.title(" 猜 数 游戏 一 by 董 付 国 ) 
# 窗 口 初 始 大 小 和 位 置 
IToot.gecmetry("280x80+ 400+ 300") 

# 不 允许 改变 窗口 大 小 
root.resizable (False, False) 


# 用 户 猜 的 数 
varNunber- tkinter.StringVar (root,value= '0') 
# 人 允许 猜 的 总 次 数 


totalTimes= tkinter. IntVar (root,value= 0) 
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# 已 猜 次 数 

already tkinter.IntVar (root,value= 0) 

# 当 前 生成 的 随机 数 

CurrentN mber= tkinter. IntVar (root,value= 0) 
# 玩 家 玩 游戏 的 总 次 数 

times= tkinter. IntVar (root,value= 0) 

# 玩 家 猜 对 的 总 次 数 

right= tkinter. IntVar (root,value= 0) 


lb= tkinter.Iabel (root,text= ' 请 输入 一 个 整数 : ') 

lb.place (= 10,y= 10,width= 100, height= 20) 

# 用 户 猜 数 并 输入 的 文本 框 

entryNunber- tkinter.Entry (root, width= 140, textvariable= varNunber) 
entryNuniber.place (= 110, y= 10, width= 140,height= 20) 

# 只 有 开始 游戏 以 后 才 允 许 输入 

entryNurber['state']= 'disabled' 


# 关 闭 程序 时 提示 战绩 

def closeWindow () : 
message= ' 共 玩 游戏 {0} 次 , 猜 对 {1} 次 ! \n 欢 迎 下 次 再 玩 ! ' 
message= message. format (times.get (0),right.get()) 
tkinter.messagebox.showinfo(' 战 绩 ',message) 
root.destroy() 

root .protoool ("WM CELETE, WINDOW', closeWindow) 


# 按 钮 单 击 事件 处 理 函 数 
def buttonclick() : 
if button['text']== 'Start Game': 
# 每 次 游戏 时 允许 用 户 自 定义 数值 范围 
# 玩 家 必须 输入 正确 的 数 
while True: 
try: 
start- tkinter.simpledialog.askinteger(' 允 许 的 最 小 整数 '， 
" 最 小 数 ',initialvalue=1) 
break 
exoept: 
pass 
while True: 
try: 
encF tkinter.simpledialog.askinteger ("允许 的 最 大 整数 '， 
"最 大 数 ',initialvalue= 10) 





# 在 用 户 自 定义 的 数值 范围 内 生成 随机 数 
currentNumber.set (randem. randint (start,end) ) 
# 用 户 自 定义 一 共 人 允许 猜 几 次 
# 玩 家 必须 输入 正确 的 整数 
while True: 
try: 
革 tkinter.simpledialog.askinteger ("最 多 允许 猜 几 次 ?'， 
' 总 次 数 ',initialvalue=3) 
totalTimes.set (t) 
break 
except: 


pass 
# 已 猜 次 数 初始 化 为 0 
already.set (0) 
button["text']= 员 余 次 数 : ' +str(t) 
# 把 文本 框 初始 化 为 0 
varNunber .set ('0') 


# 人 允许 用 户 开始 输入 整数 
entryNurber['state']= "normal' 
# 玩 游戏 的 次 数 加 1 


times.set (times.get () +1) 


# 一 共 允 许 猜 几 次 
total= totalTimes .get () 
# 本 次 游戏 的 正确 答案 
Current= currentNuriber.get () 
# 玩 家 本 次 猜 的 数 
try: 
六 int (varNunber .get ()) 
except: 
tkinter.messagsbox.showerror(" 抱 朵 "必须 输入 整数 ) 
Teturn 
if == Current: 
tkinter.messagsbox.showinfo(" 恭 喜 …' 猜 对 了 小 
button['text']= "Start Game' 
# 禁 用 文本 框 
entryNinber['state']= 'disabled" 
Tight.set (right.get() +1) 


# 已 猜 次 数 加 1 

already.set (already.get ()+ 1) 

if 2 current: 
tkinter.messagsbox.showerror(" 抱 雪 ，' 猜 的 数 太 大 了 小 

else: 
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tkinter.messagsbox.showerror(" 抱 雪 ，' 猜 的 数 太 小 了 小 
# 可 猜 次 数 用 完了 
if already-get0==total: 
tkinter.messagsbox.showerror(" 抱 赤 '， 
"游戏 结束 了 ,正确 的 数 是 : ' + 
str (currentNunber .get ())) 
button[ 'text']= 'Start Game' 
# 禁 用 文本 框 
entryNurber['state']= 'disabled' 
else: 
button['text"]= 性 余 次 数 : ' +str(total- already.get()) 
# 在 窗口 上 创建 按钮 ,并 设置 事件 处 理 函 数 
button= tkinter.Button (root, text= 'Start Game'vcammand- buttonClick) 
button.place (= 10, y= 40,width= 250, height= 20) 


# 启 动 消息 主 循环 

root mainloop() 

上 面 的 小 游戏 是 使 用 代码 生成 的 tkinter 界面 ,这 样 做 对 只 有 少量 组 件 的 界面 是 没有 
问题 的 。 但 是 ,如 果 界 面 上 需要 放置 大 量 的 组 件 ,这 样 手动 创建 就 比较 费时 费力 了 ,可 以 
考虑 使 用 PAGE 来 实现 复杂 的 界面 设计 。 

安装 好 并 启动 PAGE 之 后 ,首先 创建 一 个 Toplevel, 然 后 在 左 侧 Widget Toolbar 中 
选择 需要 创建 的 组 件 ,在 刚刚 创建 的 Toplevel 中 合适 位 置 单 击 即 可 创建 组 件 , 将 其 拖 放 
至 合适 的 位 置 ,最 后 在 右 侧 的 Attribute Editor 设置 组 件 的 属性 和 有 关 的 操作 。 界 面 设计 
好 以 后 , 单 击 菜单 Gen_Python 中 的 子 菜单 Generate Python GUI 生成 界面 程序 ,再 使 用 
菜单 Generate Support Module 生成 Python 程序 文件 ,填写 必要 的 命令 处 理 ( 如 单 击 按 
钮 ) 代 码 后 保存 即 可 。 


附录 B 计算 机 图 形 学 编程 


计算 机 图 形 学 主要 研究 如 何 使 用 计算 机 来 生成 具有 真实 感 的 图 形 ,涉及 的 内 容 主要 
包括 三 维 建 模 、 图 形 几何 变换 、 光 照 模型 纹理 映射 \ 阴 影 模 型 等 内 容 , 在 机 械 制 造 、 虚 拟 现 
实 ,增强 现实 ,游戏 开发 .漫游 系 统 设计 、 产 品 展示 等 多 个 领域 具有 重要 的 应 用 。 随 着 3D 
打印 机 的 诞生 ,只 要 有 模型 就 能 够 快速 生成 实物 ,无 疑 这 将 会 大 大 扩展 计算 机 图 形 学 的 应 
用 范围 。 例 如 ,可 以 使 用 计算 机 图 形 学 的 技术 制作 出 各 种 可 爱 的 模型 ,然后 参照 这 些 模型 
使 用 3D 打印 机 批量 生产 各 种 食品 玩偶 ,饰品 和 人 体 器 官 等 。 目 前 大 部 分 计算 机 图 形 学 
的 书籍 都 是 基于 OpenGL 的 ,Python 也 提供 了 相应 的 扩展 库 pyopengl, 提 供 了 图 形 学 编 
程 所 需要 的 所 有 API 函数 , 极 大 方便 了 编写 图 形 学 程序 的 Python 程序 员 。 下 面 的 代码 
使 用 OpenGL 绘制 了 一 个 茶壶 ,实现 了 基本 的 材质 和 光照 模型 ,并 支持 缩放 和 绕 不 同 坐 
标 轴 的 旋转 操作 。 


import sys 
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fram OpenGL.GL import x 
fram OpenGL.GLUT import * 
fram OpenGL.GLU import * 


class MyPYOpenGLTest: 
def _init _ (self,width= 640,height= 490,title=b'solidreapot'): 

glutInit (sys.argv) 
glutInitDi splayMpde (GIOT RGBA | GLOT DOUBIE | GIDT DEPTH) 
glutInitWindowSize (width,height) 
self.window= glutCreateWindow (title) 
glutDisplayFunc (self.Draw) 
# 指 定 键 盘 事件 处 理 函数 
lutkeyboardEunc (self .KeyPress) 
glutIdleFunc (self.Draw) 
self.InitGL (width,height) 
# 绕 各 坐标 轴 旋转 的 角度 
self.x=0.0 
self.y=0.0 
self.2=0.0 
# 缩 放 比 例 
self.s=1.0 


def KeyPress (self, key, x,y) : 
# 根 据 不 同 的 按键 决定 缩放 比例 和 每 个 轴 的 旋转 角度 
if key==b'a': 
self.x+=1 
elif key==b's': 
Self.x -=1 
elif key==b'j': 
self.y +=1 
elif key==b'k': 
self.y -= 工 
elif key==b'g": 
self.z +=1 
elif key==b'h': 
self.z -=1 
elif key==b'x': 
Self.s +=0.3 
elif key==b'w': 
self.s -=0.3 


# 绘 制图 形 
Gef Draw (self) : 
glClear (GL, OOLOR BUFFER BIT | GL DTEPTH BUFFER BIT) 
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glloadIdentity() 
# 平 移 
glTranslatef (0.0,0.0,— 8.0) 


# 分 别 绕 x、y、z 轴 旋转 

glRotatef (self.x,1.0,0.0,0.0) 
Rotatef (self.y,0.0,1.0,0.0) 
glRotatef (self.2,0.0,0.0,1.0) 


# 各 方向 等 比例 缩放 
glScalef (self.s, self.s, self.s) 


# 绘 制 茶 壶 
# glColor3f(0.8,0.3,1.0) 
glutsolidmeapot (1.0) 


glutSwapBuffers () 


Gef InitGL (self,width,height): 
# 初 始 化 窗口 背景 为 白色 
glClearColor (1.0,1.0,1.0,0.0) 
glClearDepth (1.0) 
lpspthEunc (GL IESS) 
# 设 置 材质 与 光源 属性 
mat sp= (1.0,1.0,1.0,1.0) 
mat_sh= [50.0] 
light _ Position= (- 0.5,1.5,1,0) 
yellow 1]= (1,0.7,0,1) 
arbient= (0.1,0.8,0.2,1.0) 
glMaterial fv (GL FRONT,GL SPECUIAR,mat sp) 
lMaterial fv (GL, FRONT,GL SHININESS,mat. sh) 
lLightfv (GL LIGHTO,GL POSTTION, light position) 
glLightfv(GL LIGHTO, GL DIFFUSE, yellow 1) 
glLightfv(GL LIGHTO, GL SPECUIAR, yellow 1) 
glLightMpdelfv(GL_ LIGHT MDDETL AMBIENT, arbient) 
# 启 用 光照 模型 
glEnable (GL LIGHTING) 
glEnable (GL LIGHTO) 
glEnable (GL TEPTH TEST) 
# 光 滑 泻 染 
glEnable (GL BIEND) 
glShadeMpdel (GL SMDOTH) 
glEnable (GL POINT SMDOTH) 
glEnable (GL LINE, SMDOTH) 
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glEnable (GL, FOLYGON SMDOTH) 

glMatrixhMpade (GL PROJECTION) 

# 反 走样 ,也 称 为 抗 锯齿 

glHint (GL, FOINT SMDOTH HINT,GL, NICEST) 

glHint (GL LINE SMDOTH HINT,GL NICEST) 

glHint (GL POLYGON SMDOTH HINT,GL FASTEST) 
loadIdentity() 

# 透 视 投 影 变换 

gluPerspective (45.0,float (width) /float (height),0.1,100.0) 
glMatrixhpde (GL MDDETVTEN) 


附录 C 图 像 编 程 


Python 扩展 库 pillow 提供 了 非常 强大 的 图 像 处 理 有 关 的 功能 ,支持 BMP、PNG、 
JPEG、GIF 等 多 种 图 像 格式 。 该 扩展 库 主要 提供 了 Image、 ImageChops、 ImageColor、 
ImageDraw ImagePath .ImageFile ImageGrab ImageTk ImageEnhance、PSDraw 以 及 其 他 
一 些 模块 来 支持 图 像 处 理 有 关 的 操作 ,而 ImageGrab 模块 还 支持 对 屏幕 指定 区 域 进行 截 
图 。 在 作者 的 另外 一 本 书 (Python 可 以 这 样 学 (清华 大 学 出 版 社 ,书号 为 9787302456469) 
中 介绍 了 大 量 的 pillow 应 用 ,这 里 就 不 再 重复 了 。 下 面 的 代码 可 以 批量 为 指定 文件 夹 中 
所 有 图 像 添加 数字 水 印 。 

fram randcm import randint 

fram os import listdir 

fram PIL import Image 


# 打 开 并 读 取 其 中 的 水 印 像素 ,也 就 是 那些 不 是 白色 背景 的 像素 
# 读 到 内 存 中 , 放 到 字典 中 以 供 快速 访问 

im Jmage.apen("watermark.hmp') 

width,height= im.size 

pixels- dict() 


for w in range (width) : 
for h in range (height): 
C= im.getpixel ((w,h)) [:3] 
if c!= (255, 255, 255) : 
pixels[(w,h)]=c 
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Gef aqqwaterMark(srcDir) : 
# 获 取 当 前 所 有 BA 图像 文件 列表 
piciles= [fn for fn in Jistdir(srcDir) if fn.endewith((' mp", .jg En9"))] 
# 遍 历 所 有 文件 ,为 每 个 图 像 添加 水 印 
for fn in picFiles: 
iml= Image.open (fn) 
Wh iml.size 
# 如 果 图 片 尺寸 小 于 水 印 图 片 ,不 加 水 印 
if wwidth or hx height: 
Continue 
# 在 原始 图 像 左上 角 、 中 间或 右 下 角 添 加 数字 水 印 
# 具 体位 置 根据 position 进 行 随 机 选择 
Fr {0: (0,0) ,1: ((w- width)//2, pr height) //2) ,2: (w- width,h- height)} 
position= randint (0,2) 
top, left=p.get (position, (0,0)) 
# 修 改 像素 值 ,添加 水 印 
for prc in pixels.items(): 
iml .putpixel ((p[0]+ top,p[1]+ left)vc) 
# 保 存 加 入 水 印 之 后 的 新 图 像 文件 
iml.save(fn[:- 4] + ' new' +fn[- 4:]) 


# 为 当前 文件 夹 中 的 图 像 文件 添加 水 印 
adWaterMark ('.') 


下 面 的 代码 用 来 把 水 印信 息 打 散 后 添加 到 图 像 中 的 随机 位 置 ,并 可 以 重新 把 水 印信 
息 提 取出 来 。 


fram os import remove 

fram os.path import isfile 

fram Irandcm import sanple, choice 
fram PIL import Image 


def mergeWaterMark (originPic,watermarkPic, logTxt): 
# 原 始 图 片 和 水 印 文件 必须 为 图 片 格式 
if ((not originPic.endswith(('.jpg' .bm' -png"))) or 
(not watemmarkPic.endswith(('".jpg .bm .png')))): 
Teturn "Error fomat." 


# 打 开 原 图 和 水 印 图 片 ,并 获取 大 小 

inOrigin= Image.apen (originPic) 
ee 
inWaterMarlke= Image.cpen watermarkPic) 
watemrarKWidth, watermarkHeight— inWaterMark.size 


# 随 机 生成 水 印 位置 
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allPositions= [ wh) for w in range (origirWidth) for h in range(originHeight)] 
positions= sanple (allPositions,watermarkWidth* watermarkHeight) 


fpLogr- open (logTxt, 'w') 
# 写 人 水 印 文 件 的 大 小 
fpLog-write (str ( (watermarkWidth, watermarkHeight))+ '\n') 


for w in range (watermarkWidth) : 
for h in range (watermarkHeight) : 
c= inWaterMark.getpixel ((w,h)) 
cc[:3] 
# 只 写 人 不 是 白色 的 像素 
if c != (255,255, 255) : 
IF choice (positions) 
# 写 人 像素 值 
imorigin.putpixel (p,c) 
# 避免 重复 修改 同一 个 像素 
positions.remove (p) 
# 生 成 日 志文 件 ,用 来 提取 水 印 
fplog.write (str (pt (wh))+ "\n') 
fpLog.close() 
# 生 成 加 入 水 印 的 新 图 片 
inOrigin.save (originPic[:- 4]+ '_new'+originPic[- 4:]) 


Gef restoreWaterMark (mergedPic, logTxt,watermmarkPic) : 
# 首 先 删除 原来 提取 过 的 水 印 文件 
if isfile (watermarkPic) : 
ITemcve (watermarkPic) 
inMerged= Image.open (mergedPic) 
with open (logTxt) as fp: 
for line in fp: 
# 读 取 每 一 行 并 还 原 为 元 组 
line= eval (line.strip()) 
# 第 一 行 是 水 印 图 片 尺寸 , 先 创建 水 印 文件 
if len(line)==2: 
inWaterMark= Image.new ('RGB', line, (255, 255, 255)) 
else: 
# 提 取水 印 像素 并 写 人 水 印 文件 
= inMerged.getpixel ((line[0], line[1])) 
c=c[:3] 
inWaterMark.putpixel ((line[2], line[3]),c) 
# 保 存 提取 的 水 印 


inWaterMark.save (watermarkPic) 
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. 
# 添 加 水 印 
mergeWaterMark ('origin.hrp', "watermark-png' '109g.txt') 
# 提 取水 印 
restoreWaterMark ('origin new.bmp' "logg.txt', "restoredWaterMark-png") 


附录 D 密码 学 编程 


除了 自己 设计 加 密 算法 或 者 自己 编写 程序 实现 经 典 的 加 密 解密 算法 之 外 ,还 可 以 充 
分 利用 Python 标准 库 和 扩展 库 提供 的 丰富 功能 。Python 标准 库 hashlib 实现 了 SHAI1、 
SHA224、SHA256、SHA384、SHA512 以 及 MD5 等 多 个 安全 哈 希 算法 ,标准 库 zlib 提供 
了 adler32 和 crc32 算法 的 实现 ,标准 库 hmac 实现 了 HMAC 算法 。 在 众多 的 Python 扩 
展 库 中 ,pycryptodome 可 以 说 是 密码 学 编程 模块 中 最 成 功 也 是 最 成 熟 的 一 个 ,封装 了 密 
码 学 有 关 的 大 量 算法 ,具有 很 高 的 市 场 占有 率 。 另 外 ,cryptography 也 有 一 定数 量 的 用 户 
在 使 用 。 扩 展 库 pycryptodome 和 cryptography 提供 了 SHA 系列 算法 和 RIPEMD160 
等 多 个 安全 喻 希 算法 ,以 及 DES、AES、RSA、DSA、ElGamal 等 多 个 加 密 算法 和 数字 签名 
算法 的 实现 。 


系统 运 维 涉 及 的 内 容 非 常 广泛 ,如 内 存 `.CPU、 网 络 带宽 等 资源 的 占用 率 以 及 磁盘 配 
额 情况 的 实时 查看 ,进程 列表 、 线 程 列表 以 及 用 户 文件 变化 情况 的 动态 跟踪 ,网 络 主机 IP 
地 址 的 动态 分 配 与 回收 以 及 DNS 管理 ,用 户 文件 变化 情况 ,病毒 防护 与 入 侵 检测 ,必要 时 
给 系统 管理 员 发 送 邮件 ,历史 数据 永久 化 以 及 相关 图 表 生成 ,等 等 。 当 然 , 严 格 地 说 ,保持 
供电 和 供水 系统 的 正常 工作 也 属于 系统 运 维 的 范畴 ,不 过 这 些 内 容 不 在 本 书 讨论 范围 之 
内 。 在 编写 系统 运 维 程序 时 常用 的 Python 标准 库 和 扩展 库 如 下 。 

(1) difflib: 可 以 比较 文件 差异 并 可 以 生成 不 同 格式 的 比较 结果 。 

(2) fileemp: 用 于 实现 文件 与 文件 夹 的 差异 比较 。 

(3) smtplib、poplib,ftplib: 邮件 收发 与 FTP 空间 访问 。 

(4) ansible-playbook: 轻 量 级 多 主机 部 署 与 配置 管理 系统 。 

(5) dnspython: DNS 工具 包 , 支 持 几乎 所 有 记录 类 型 。 

(6) ipy: 用 于 管理 IPv4 和 IPv6 地 址 与 网 络 的 工具 包 。 

(7) paramiko: 提供 了 SSHv2 协议 的 服务 端 和 客户 端 功能 。 

(8) psutil: 可 以 获取 内 存 `.CPU、 磁 盘 、 网 络 的 使 用 情况 ,查看 系统 进程 与 线程 信息 ， 
并 具有 一 定 的 进程 和 线程 管理 功能 。 

(9) pyclamad: 提供 了 免费 开源 杀毒 软件 Clam Antivirus 的 访问 接口 。 

(10) pycurl: 对 libcurl 的 封装 ,类 似 于 标准 库 urllib, 但 功能 更 强大 。 

(11) python-rrdtool: 提供 了 rddtool 的 访问 接口 。rddtool 主要 用 来 跟踪 对 象 的 变 
化 情况 并 生成 走势 图 ,如 业务 的 访问 流量 、 系 统 性 能 、 磁 盘 利 用 率 等 趋势 图 。 
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(12) scapy: 交互 式 数据 包 处 理工 具 包 ,支持 各 种 网 络 数据 包 的 解析 和 伪造 。 
(13) xlrd、xlwt、openpyxl: 支持 不 同 版 本 Excel 文件 的 读 写 操作 ,包括 数字 、 文 本 、 公 
式 、 图 表 。 


附录 Windows 系统 编程 


绝 大 多 数 版 本 的 Linux 系统 中 都 内 置 了 Python 解释 器 ,而 在 Windows 平台 上 一 般 需 要 
单独 安装 ,尽管 如 此 ,Python 在 Windows 平台 上 的 表现 也 是 非常 不 俗 的 , 绝 大 部 分 标准 库 中 
的 功能 都 能 在 Windows 平台 上 使 用 ,并 且 还 拥有 大 量 专门 针对 Windows 的 扩展 库 。 

(1) ctypes: Python 标准 库 ctypes 提供 了 访问 . dll 或 . so 等 不 同类 型 动态 链接 库 中 
函数 的 接口 ,很 好 地 支持 了 与 C/C++ 等 语言 混合 编程 的 需求 ,可 以 调用 操作 系统 底层 
API 函数 。 

(2) os: 可 以 调用 Windows 内 部 命令 和 外 部 程序 ,提供 了 一 定 的 文件 与 文件 夹 管理 
功能 以 及 进程 管理 功能 。 

(3) platform: 扩 平 台 的 标准 库 , 实 现 了 与 系统 平台 有 关 的 部 分 功能 ,如 查看 机 型 、 
CPU 操作 系统 类 型 等 信息 。 

(4) winreg: 提供 了 用 于 操作 Windows 系统 注册 表 的 大 部 分 功能 。 

(5) wmi: 提供 了 Windows Management Instrumentation (WMDJ) 的 访问 接口 。 

(6) py2exe: 可 以 用 来 把 Python 程序 打包 成 可 以 脱离 Python 解释 器 环境 并 独立 运 
行 在 Windows 平台 上 的 可 执行 程序 。 

(7) pywin32: 包 括 win32api、win32process、win32api、win32con、win32gui、 
win32evtlog .win32security、winerror 等 大 量 模块 ,对 Windows 底层 API 进行 了 完美 的 
封装 ,几乎 支持 Windows 平台 上 的 所 有 操作 。 

为 了 方便 教学 ,作者 使 用 Python 开发 了 一 套 教学 管理 软件 ,具有 在 线 点 名 、 提 问答 
疑 , 交 作业 、 自 测 、 在 线 考试 数据 导入 导出 与 汇总 .Word 试卷 生成 等 多 个 功能 ,其 中 在 线 
考试 系统 具有 防 作弊 的 功能 ,不 少 人 觉得 很 神奇 ,其实 思路 和 代码 都 很 简单 。 主 要 的 原理 
是 关闭 文本 编辑 器 并 定时 清空 系统 剪贴 板 , 不 允许 复制 题目 和 其 他 任何 内 容 ,也 不 允许 打 
开 浏 览 器 搜索 网 页 ,只 能 一 个 题 一 个 题 地 做 ,并 且 每 个 人 都 是 随机 抽 题 ,题库 里 有 700 多 
道 题 ,所 以 相 邻 的 两 个 人 同一 时 间 抽 到 同一 题 的 概率 非常 小 ,有 效 防止 了 作弊 。 下 面 的 代 
码 模拟 了 这 个 功能 , 单 击 “ 开 始 考试 ?按钮 启用 考试 模式 的 防 作 棘 功能 , 单 击 * 结 束 考 试 ? 则 
禁用 防 作弊 功能 。 代 码 主要 使 用 了 标准 库 ctypes 和 扩展 库 psutil 中 的 部 分 功能 。 

import os 

import time 

import tkinter 

import threading 

import ctypes 

import peutil 


Ioot= tkinter.Tk() 
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root.title(' 防 作 次 演示 一 一 by 董 付 国 ') 
# 窗 口 初始 大 小 和 位 置 
root.geametry("250x80+ 300+ 100") 

# 不 允许 改变 窗口 大 小 

root .resizable (False, False) 

jinyong= tkinter. IntVar (root, 0) 


Gef funcJinyong(): 
while jinyong.get ()==1: 
# 强 行 关闭 主流 文本 编辑 器 和 网 页 浏览 器 
for pid in psutil .pids(): 
try: 
FF psutil.Prooess (pid) 
exeName= 03.path.basename (p.exe ()) .lower() 
if exeName in ('notepad.exe', 'winword.exe', 
‘wps .exe', 'wordpad.exe', 'iexplore.exe' 
‘hrame .exe', 'qdbrowser .exe', 
"360chrome.exe' '360se.exe', 
"sogouexplorer .exe', 'firefox.exe', 
"opera.exe' "maxthon.exe' 
metscape.exe' 'baidubrowser .exe', 
'2345Explorer .exe') : 
P-Kil() 


# 清 空 系 统 剪贴 板 

ctypes.windl] .user32.0penClipgiboard (None) 
Ctypes.windl] .user32.Erptyclipboard!() 
ctypes.windll .user32.CloseClipboard!() 
time.sleep(1) 


def start(): 
jinyong.set (1) 
t= threading. Thread (target= funcJinyong) 
七 start () 


buttonstart= tkinter.Button (root, text= ' 开 始 考试 ,commandF start) 
buttonStart .place (= 20, y= 10,width= 100,height= 20) 


aef stop(): 
jinyong.set (0) 

buttonstop= tkinter.Button (root,text= "结束 考 试 ',oqmmand= stop) 

buttonSstop.place (x= 130, y= 10,width= 100, height— 20) 


# 模 拟 用 ,开启 考试 模式 以 后 ,所 有 内 容 都 不 再 允许 复制 
entryMessage— tkinter.Entry (root) 
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entryMessage.place (x= 10, y= 40,width= 230, height= 20) 


root .mainlocp() 


附录 G 软件 分 析 与 逆向 工程 


在 软件 分 析 和 北向 工程 领域 ,有 大 量 的 成 熟 工具 以 及 针对 不 同 工 具 和 目的 开发 的 各 
种 插件 ,如 IDA Pro、 OllyDbg、 WinDbg、W32DASM. PEid、 ssdeep、DiStorm、 DisView、 
LordPE、PIN、Universal PE Unpacker、Sample Chart Builder 等 ,可 以 说 是 数不胜数 。 下 
面 简单 列 出 使 用 Python 开发 或 可 以 使 用 Python 进行 二 次 开发 的 工具 和 插件 。 

(1) PyEmu: 可 编写 脚本 的 模拟 器 ,对 恶意 软件 分 析 非 常 有 用 。 

(2) Immunity Debugger: 著名 的 调试 器 ,是 在 OllyDbg 的 源 代码 基础 上 建立 起 来 
的 ,外 观 和 用 法 都 与 OllyDbg 非常 相似 ,并 且 两 者 共享 很 多 的 底层 功能 和 控制 。 
Immunity Debugger 带 有 内 置 的 Python 接口 和 专门 用 于 研究 漏洞 和 执行 恶意 软件 分 析 
的 强大 API, 是 可 编写 脚本 的 GUI 和 命令 行 软件 调试 器 ,支持 exploit 编写 .二进制 可 执 
行文 件 逆向 工程 等 各 种 应 用 。 

(3) Paimei: 完全 使 用 Python 编写 ,是 非常 成 熟 的 逆向 工程 框架 ,包括 PyDBG、 
PIDA 、.pGRAPH 等 多 个 可 扩展 模块 ,可 以 执行 大 量 静 态 分 析 和 动态 分 析 , 如 模糊 测试 、 代 

(4) ropper: 比较 成 熟 的 ROP Gadgets 查找 与 可 执行 文件 分 析 工 具 , 其 反 汇 编 部 分 
使 用 了 成 熟 的 Capstone 框架 。 

(5) WinAppDbg: 纯 Python 调试 器 ,没有 本 机 代码 ,使 用 ctypes 封装 了 许多 与 调试 
器 有 关 的 Win32 API 调用 ,并 且 为 操作 线程 和 进程 提供 了 强 有 力 的 抽象 。 利 用 该 工具 可 
以 将 自己 编写 的 脚本 附加 为 调试 器 .跟踪 执行 .拦截 API 调用 ,以 及 在 待 调试 进程 中 处 理 
事件 ,并 且 可 以 设置 各 种 断 点 。 

(6) YARA: 恶意 软件 识别 和 分 类 引擎 也 可 以 利用 YARA 创建 规则 以 检测 字符 串 、 人 
侵 序 列 、 正 则 表达 式 、 字 节 模 式 等 。 既 可 以 使 用 命令 行 模式 下 的 yara 工具 扫描 文件 ,也 可 以 
利用 YARA 提供 的 API 函数 将 yara 扫描 引擎 集成 到 C 或 Python 语言 编写 的 工具 中 。 

(7) pefile: 可 以 读 取 和 处 理 PE 文件 。 

(8) IDAPython: IDA 插件 ,IDAPython 是 运行 于 交互 式 反 汇编 器 IDA 的 插件 ,用 于 
实现 IDA 的 Python 编程 接口 。IDA 在 逆向 工程 领域 具有 广泛 的 应 用 ,尤其 是 二 进 制 文 
件 静 态 分 析 , 其 强大 的 反 汇 编 功 能 一 直 处 于 业内 领先 水 平 。IDAPython 插件 使 得 Python 
脚本 程序 能 够 在 IDA 中 运行 并 实现 自 定义 的 软件 分 析 功 能 ,通过 该 插件 运行 的 Python 
脚本 程序 可 以 访问 整个 IDA 数据 库 , 并 且 可 以 方便 地 调用 所 有 IDC 函数 和 使 用 所 有 已 安 
装 的 Python 模块 中 的 功能 。 目 前 IDAPython 还 不 支持 Python3 , 较 高 版 本 的 IDA 中 集 
成 了 IDAPython 插件 ,如 果 需 要 安装 或 升级 ,需要 登录 其 官方 网 站 下 载 安装 适合 已 安装 
Python 和 IDA 版 本 的 IDAPython 插件 。 

(9) Hex-Rays Decompiler: IDA 插件 ,非常 成 熟 的 反 编 译 插件 。 
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(10) PatchDiff2: IDA 插件 ,主要 用 于 补丁 对 比 。 

(11) BinDiff: IDA 插件 ,主要 用 于 二 进 制 文件 差异 比较 。 

(12) hidedebug: Immunity Debugger 插件 ,可 以 隐藏 调试 器 的 存在 ,用 来 对 抗 某 些 
通用 的 反 调试 技术 。 

(13) IDAStealth: IDA 插件 ,可 隐藏 IDA debugger 的 存在 ,用 来 对 抗 某 些 通用 的 反 
调试 技术 。 

(14) MyNav: IDA 插件 ,能 够 帮助 逆向 工程 师 完成 一 些 最 典型 的 任务 ,如 发 现 一 些 
特定 功能 或 任务 是 由 哪些 函数 实现 的 , 找 出 补丁 前 后 函数 的 不 同 之 处 和 数据 入 口 。 

(15) Lobotomy: 一 款 应 用 于 Python 的 安 卓 渗透 测试 工具 包 , 可 以 帮助 安全 研究 人 
员 评 估 不 同 Android 道 向 工程 任务 。 

特别 需要 注意 的 是 ,应 尽量 避免 直接 在 本 地 物理 主机 上 分 析 恶 意 软件 ,以免 被 恶意 软 
件 感染 而 造成 不 必要 的 损失 。 为 了 保证 物理 主机 安全 ,同时 也 为 了 能 够 在 分 析 环 境 被 恶 
意 软 件 感染 之 后 快速 恢复 系统 ,建议 使 用 VirtualBox、VMware、QEMU 等 虚拟 机 系统 或 
沙 箱 系统 进行 保护 。 如 果 没 有 条 件 使 用 虚拟 机 或 沙 箱 系 统 ,最 好 使 用 Deep Freeze、 
Truman、\FPG 或 其 他 类 似 软 件 来 保护 物理 主机 以 防 系统 被 感染 。 
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